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(57) Abstract 

The invention concerns a nucleic material, in isolated or purified state, and a nucleotide fragment comprising a nucleotide sequence 
selected from the group consisting in (i) the sequences SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117, SEQ ID NO: 120, SEQ 
ID NO. 124, SEQ ID NO: 130, SEQ ID NO: 141 and SEQ ID NO: 142, (ii) the complementary sequences of sequences (i); and (iii) the 
sequences equivalent to sequences (ii) and (iii), in particular the sequence having for every series of 100 contiguous monomers, at least 
50 %, preferably 70 % homology with sequences (i) and (ii) respectively. The invention also concerns their uses for detecting a retrovirus 
associated with multiple sclerosis and/or rheumatoid arthritis. 



(57) Abrege* 

Materiel nucl&que, a T6tat isole" ou purifie\ et fragment nuclfiotidique, comprenant une sequence nucteotidique choisie dans le groupe 
qui consiste en (i) les sequences SEQ ID NO: 1 12, SEQ ID NO:l 14, SEQ ID NO: 1 17, SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 
130, SEQ ID NO: 141 et SEQ ID NO: 142, (ii) les sequences complementaires des sequences (i); et (iii) les sequences 6quivalentes aux 
sequences (i) ou (ii), en particulier les sequences presentant pour toute suite de 100 monomeres contigus, au moins 50 %, et pr6f6rentiellement 
au moins 70 % d'homologie avec respectivement les sequences (i) ou (ii), et utilisations pour d£tecter un retrovirus associe* a la scl6rose en 
plaques et/ou la polyarthrite rhumatoide. 
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MATERIEL NUCLEIQUE RETROVIRAL ET FRAGMENTS NUCLEOTIDIQUES 
NOTAMMENT ASSOCIES A LA SCLEROSE EN PLAQUES ET/OU LA 
POLYARTHRITE RHUMATOIDE , A DES FINS DE DIAGNOSTIC, 
PROPHYLACTIQUES ET THERAPEUTIQUES 

5 La Sclerose en Plaques (SEP) est une maladie 

demyelinisante du systeme nerveux central (SNC) dont la 
cause complete reste encore inconnue . 

De nombreux travaux ont etaye I'hypothese d'une 
etiologie virale de la maladie, mais aucun des virus 
10 connus testes ne s'est avere etre 1 1 agent causal 
recherche: une revue des virus recherches depuis des 
annees dans la SEP a ete faite par E. Norrby et R. T. 
Johnson. 

Recemment, un retrovirus, different des retrovirus 

15 humains connus a ete isole chez des patients atteints de 
SEP. Les auteurs ont aussi pu montrer que ce retrovirus 
pouvait etre transmis in vitro, que des patients atteints 
de SEP produisaient des anticorps susceptibles de 
reconnaitre des proteines associees a 1 1 infection des 

2 0 cellules leptomeningees par ce retrovirus, et que 
1' expression de ce dernier pouvait etre fortement stimulee 
par les genes immediats-precoces de certains herpesvirus. 

Tous ces resultats plaident en faveur du role dans 
la SEP d'au moins un retrovirus inconnu ou d'un virus 

25 ayant une activite transcriptase inverse (RT) detectable 
selon la methode publiee par H. Perron et qualifiee 
d* activite "RT de type LM7" . 

Les travaux de la Demanderesse ont permis 
d'obtenir deux lignees continues de cellules infectees par 

30 des isolats naturels provenant de deux patients differents 
atteints de SEP, par un procede de culture tel que deer it 
dans le document WO-A-93 20188, dont le contenu est 
incorpore par reference a la presente description. Ces 
deux lignees derivees de cellules de plexus-choroides 

35 humains, denommees LM7PC et PLI-2 ont ete deposees a 
I'E.C.A.C.C. respectivement le 22 juillet 1992 et le 8 
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2 

janvier 1993, sous les numeros 92 072201 et 93 010817, 
conf ormement aux dispositions du Traite de Budapest. Par 
ailleurs, les isolats viraux possedant une activite RT de 
type LM7 ont egalement ete deposes a l'E.C.A.C.C. sous la 
5 denomination globale de "souches". La "souche" ou isolat 
heberge par la lignee PLI-2, denommee POL-2 , a ete deposee 
aupres de l'E.C.A.C.C- le 22 juillet 1992 sous le 
n° V92072202. La "souche" ou isolat heberge par la lignee 
LM7PC , denommee MS7PG, a ete deposee aupres de 

10 l'E.C.A.C.C. le 8 janvier 1993 sous le n° V93010816. 

A partir des cultures et des isolats precites, 
caracterises par des criteres biologiques et 
morphologiques , on s ' est ensuite attache a caracteriser le 
materiel nucleique associe aux particules virales 

15 produites dans ces cultures. 

Les portions de genome deja caracterisees ont ete 
utilisees pour mettre au point des tests de detection 
moleculaire du genome viral et des tests 
immunoserologiques , utilisant les sequences d ' amineoacides 

20 codees par les sequences nucleot idiques du genome viral, 
pour detecter la reponse immunitaire dirigee contre des 
epitopes associes a 1 ' infection et/ou 1' expression virale. 

Ces outils ont deja permis de confirmer une 
association entre la SEP et 1* expression des sequences 

25 identifiees dans les brevets cites plus loin. Cependant, 
le systeme viral decouvert par la Demanderesse , 
s ' apparente a un systeme retroviral complexe. En effet, 
les sequences retrouvees encapsidees dans les particules 
virales extracellulaires produites par les differentes 

30 cultures de cellules de patients atteints de SEP, montrent 
clairement qu'il y a co-encapsidation de genomes 
retroviraux apparentes, mais differents du genome 
retroviral "sauvage" qui produit les particules virales 
infectantes. Ce phenomene a ete observe entre des 

35 retrovirus replicatifs et des retrovirus endogenes 
appartenant a la meme f ami lie, voire meme heterologues . La 
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notion de retrovirus endogene est tres importante dans le 
contexte de notre decouverte car, dans le cas de MSRV-1, 
on a observe que des sequences retrovirales endogenes 
comprenant des sequences homologues au genome MSRV-1, 
5 existent dans l^DN humain normal. L 1 existence d' elements 
retroviraux endogenes (ERV) apparentes a MSRV-1 par tout 
ou partie de leur genome, explique le fait que 
1' expression du retrovirus MSRV-1 dans les cellules 
humaines puisse interagir avec des sequences endogenes 

10 proches. Ces interactions sont retrouvees dans le cas de 
retrovirus endogenes pathogenes et/ou infectieux (par 
exemple certaines souches ecotropes du Murine Leukaemia 
virus) , dans le cas de retrovirus exogenes dont la 
sequence nucleot idique peut etre retrouvee partiellement 

15 ou en total ite, sous forme d'ERVs, dans le genome de 
1' animal hote (ex. virus exogene de la tumeur mammaire de 
la souris transmis par le lait) . Ces interactions 
consistent principalement en (i) une transact ivation ou 
co-activation d'ERVs par le retrovirus replicatif, (ii) 

20 une encapsidation "illegitime" d'ARN apparentes d'ERVS, ou 
d'ERVs -voire d'ARN cellulaires- possedant simplement des 
sequences d 1 encapsidation compatibles, dans les particules 
retrovirales produites par l 1 expression de la souche 
replicative, parfois transmissibles et parfois avec une 

25 pathogenicity propre, et (iii) des recombinaisons plus ou 
moins importantes entre les genomes co-encapsides , 
notamment dans les phases de transcription inverse, qui 
conduisent a la formation de genomes hybrides, parfois 
transmissibles et parfois avec une pathogenicity propre. 

30 Ainsi, (i) differentes sequences apparentees a 

MSRV-1 ont ete retrouvees dans les particules virales 
purifiees; (ii) 1 1 analyse moleculaire des differentes 
regions du genome retroviral MSRV-1 doit etre faite en 
analysant systematiquement les sequences co-encapsidees, 

35 interf erantes et/ou recombinees qui sont generees par 
l 1 infection et/ou 1' expression de MSRV-1, de plus, 
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certains clones peuvent avoir des parties de sequences 
defectives produites par la replication retrovirale et les 
erreurs de matrice et/ou de transcription de la 
transcriptase inverse; (iii) les families de sequences 
5 apparentees a une meme region genomique retrovirale sont 
les supports d 1 une detection diagnostique globale qui peut 
etre optimisee par 1 ' identif ication de regions invar iables 
parmi les clones exprimes et par 1 1 identif ication de 
trames de lectures responsables de la production de 

10 polypeptides antigeniques et/ou pathogenes qui peuvent 
n'etre produits que par une partie, voire un seul, des 
clones exprimes et dans ces conditions, l 1 analyse 
systematique des clones exprimes dans une region d'un gene 
donne permet d'evaluer la frequence de variation et/ou de 

15 recombinaison du genome MSRV-1 dans cette region et de 
definir les sequences optimales pour les applications, 
notamment diagnostiques ; (iv) la pathologie provoquee par 
un retrovirus tel que MSRV-1 peut etre un effet direct de 
son expression et des proteines ou peptides produits de ce 

20 fait, mais aussi un effet de 1 1 activation , de 
1 1 encapsidation, de la recombinaison de genomes apparentes 
ou heterologues et des proteines ou peptides produits de 
ces faits ; ainsi ces genomes associes a 1' expression de 
et/ou 1* infection par MSRV-1 sont-ils une partie 

25 integrante de la pathogenicity potentielle de ce virus et 
done, constituent des supports de detection diagnostique 
et des cibles therapeutiques particulieres . De meme, tout 
agent associe a, ou, co-facteur de ces interactions 
responsables de la pathogenie en cause, tel que MSRV-2 ou 

30 le facteur gliotoxique decrit dans la demande de brevet 
publiee sous le N° FR-2 716 198, peut participer a 
1 • elaboration d'une strategie globale et tres efficace de 
diagnostic, de pronostic, de suivi therapeutique et/ou de 
therapeutique integree de la SEP notamment, mais aussi de 

35 toute autre maladie associee aux memes agents. 
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Dans ce contexte, on a fait une decouverte 
parallele dans une autre maladie autoimmune, la 
polyarthrite rhumatoide (PR) , qui a ete decrite dans la 
demande de brevet fran<?ais depdsee sous le N°95 02960. 
5 Cette decouverte montre que, en appliquant des approches 
methodologiques similaires a celles qui furent utilisees 
dans les travaux de la Demanderesse sur la SEP, on a pu 
identifier un retrovirus exprime dans la PR qui partage 
les sequences decrites pour MSRV-1 dans la SEP et aussi, 

10 la co-existence d'une sequence associee MSRV-2 egalement 
decrite dans la SEP. En ce qui concerne MSRV-1, les 
sequences detectees communement dans la SEP et la PR, 
concernent les genes pol et gag- En 1 1 etat actuel des 
connaissances , on peut associer les sequences gag et pol 

15 decrites aux souches MSRV-1 exprimees dans ces deux 
maladies . 

La presente demande de brevet a pour objet 
differents resultats, supplementaires par rapport a ceux 
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La presente invention concerne tout d'abord un 
materiel nucleique, qui peut consister en un materiel 
retroviral, a l'etat isole ou purifie, pouvant etre 
apprehende ou caracterise de differentes manieres : 
35 - il comprend une sequence nucleotidique choisie 

dans le groupe qui consiste en (i) les sequences 
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SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117, 

SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 130, 

SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii) les sequences 
complementaires aux sequences (i) ; et (iii) les sequences 
5 equivalentes aux sequences (i) ou (ii), en particulier les 
sequences presentant pour toute suite de 100 monomeres 
contigus, au moins 50 %, et pref erentiellement au moins 
70 % d'homologie avec respect ivement les sequences (i) ou 
(ii) ; 

10 - il code pour un polypeptide presentant, pour 

toute suite contigue d 1 au moins 30 acides aminees, au 
moins 50 %, et de preference au moins 70 % d'homologie, 
avec une sequence peptidique choisie dans le groupe qui 
consiste en SEQ ID NO: 113, SEQ ID N°115, SEQ ID NO: 118, 

15 SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137; 

- son gene pol comprend une sequence nucleotidique 
identique ou equivalente a une sequence choisie dans le 
groupe qui consiste en SEQ ID NO: 112, SEQ ID NO: 124 et 
leurs sequences complementaires; 

20 - l'extremite 5* de son gene pol commence au 

nucleotide 1419 de SEQ ID NO: 130; 

- son gene pol code pour un polypeptide 
presentant, pour toute suite contigue d 1 au moins 30 acides 
aminees, au moins 50 %, et de preference au moins 70 % 

25 d'homologie, avec la sequence peptidique SEQ ID NO: 113; 

- l'extremite 3' de son gene gag finit au 
nucleotide 1418 de SEQ ID NO: 130; 

- son gene env comprend une sequence nucleotidique 
identique ou equivalente a une sequence choisie dans le 

30 groupe qui consiste en SEQ ID NO: 117, et ses sequences 
complementaires ; 

- son gene env comprend une sequence nucleotidique 
qui commence au nucleotide 1 de SEQ ID NO: 117 et finit au 
nucleotide au nucleotide 233 de SEQ ID NO: 114; 

35 - son gene env code pour un polypeptide 

presentant, pour toute suite contigue d'au moins 30 acides 
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aminees, au moins 50 %, et de preference au moins 70 % 
d'homologie, avec la sequence SEQ ID NO:°118; 

- la region U3R de son LTR 3 1 comprend une 
sequence nucleot idique qui se termine au nucleotide 617 de 

5 SEQ ID NO: 114; 

- la region RU5 de son LTR 5 • comprend une 
sequence nucleotidique qui commence au nucleotide 755 de 
SEQ ID NO: 120 et finit au nucleotide 337 de 
SEQ ID NO: 141 ou SEQ ID NO: 14 2; 

10 - un materiel nucleique retroviral comprenant une 

sequence qui commence au nucleotide 7 55 de SEQ ID NO: 120 
et qui se termine au nucleotide 617 de SEQ ID NO: 114; 

- le materiel nucleique retroviral tel que defini 
precedemment est en particulier associe a au moins une. 

15 maladie auto-immune telle que la sclerose en plaques ou la 
polyarthr ite rhumatoide . 

L 1 invention concerne aussi un fragment 
nucleotidique qui repond au moins a 1 1 une des definitions, 
suivantes : 

2 0 - il comprend ou consiste en une sequence 

nucleotidique choisie dans le groupe qui consiste en (i) 
les sequences SEQ ID NO: 112, SEQ ID NO: 114, 

SEQ ID NO: 117, SEQ ID NO: 120, SEQ ID NO: 124, 

SEQ ID NO: 130, SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii) 

25 les sequences complementaires des sequences (i) ; et (iii) 
les sequences equivalentes aux sequences (i) ou (ii) , en 
particulier les sequences presentant pour toute suite de 
100 monomeres contigus, au moins 50 %, et 
preferentiellement au moins 70 % d'homologie avec 

30 respectivement les sequences (i) ou (ii) ; 

- il comprend ou consiste en une sequence 
nucleotidique codant pour un polypeptide presentant, pour 
toute suite contigue d'au moins 3 0 acides aminees, au 
moins 50 %, et de preference au moins 70 % d f homologie, 

3 5 avec une sequence pept idique choisie dans le groupe qui 
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consiste en SEQ ID NO: 113, SEQ ID N°115, SEQ ID NO: 118, 
SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

D ' autres objets de la presente invention sont les 
suivants : 

5 - une sonde nucleique pour la detection d 1 un 

retrovirus associe a la sclerose en plaques et/ou la 
polyarthrite rhumatoide , susceptible de s ' hybrider 
specif iquement sur tout fragment precedemment defini et 
appartenant au genome dud it retrovirus ; elle possede 
10 avantageusement de 10 a 100 nucleotides, de preference de 
10 a 30 nucleotides ; 

- une amorce pour 1 1 amplif ication par 
polymerisation d'un ARN ou d'un ADN d'un retrovirus 
associe a la sclerose en plaques et/ou la polyarthrite 

15 rhumatoide, qui comprend une sequence nucleotidique 
identique ou equivalente a au moins une partie de la 
sequence nucleotidique d'un fragment defini precedemment, 
notamment une sequence nucleotidique presentant pour toute 
suite de 10 monomeres contigus, au moins 50 %, de 

20 preference au moins 70 % d'homologie avec au moins ladite 
partie dudit fragment ; de preference la sequence 
nucleotidique d'une amorce de 1' invention est choisie 
parmi SEQ ID NO: 116, SEQ ID NO: 119, SEQ ID NO: 122, 
SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, 

25 SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 132, et 

SEQ ID NO: 13 3; 

- un ARN ou ADN, et notamment vecteur de 
replication et/ou d 1 expression , comprenant un fragment 
genomique du materiel nucleique ou un fragment defini 

3 0 precedemment ; 

- un peptide code par tout cadre de lecture ouvert 
appartenant a un fragment nucleotidique defini 
precedemment, notamment un polypeptide, par exemple 
oligopeptide formant ou comprenant un determinant 

3 5 antigenique reconnu par des sera de patients infectes par 
le virus MSRV-1, et/ou chez lesquels le virus MSRV-1 a ete 



BNSDOCID:<WO 9902666A2> 



WO 99/02666 



PCT/FR98/01460 



reactive; un peptide preferentiel comprend une sequence 
identique, partiellement ou totalement, ou equivalente a 
une sequence choisie parmi SEQ ID NO: 113, SEQ ID N°115 / 
SEQ ID NO: 118, SEQ ID NO: 121, SEQ ID NO: 135 et 

5 SEQ ID NO: 137; 

- une composition diagnostique , prophy lactique , ou 
therapeutique, notamment pour inhiber l 1 expression d 1 au 
moins un retrovirus associe a la sclerose en plaques et/ou 
a la polyarthrite rhumatoide, comprenant un fragment 

10 nucleotidique defini precedemment ; 

- un procede pour detecter un retrovirus associe a 
la sclerose en plaques et/ou a la polyarthrite rhumatoide, 
dans un echantillon biologique, comprenant les etapes 
consistant a mettre en contact un ARN et/ou un ADN presume 

15 appartenir ou provenant dudit retrovirus, ou leur ARN 
et/ou ADN complementaire, avec une composition comprenant 
un fragment nucleotidique defini ci-dessus. 

Avant de detainer 1' invention, differents termes 
utilises dans la description et les revendications sont a 

20 present definis : 

- par souche ou isolat, on entend toute fraction 
biologique infectante et/ou pathogene, contenant par 
exemple des virus et/ou des bacteries et/ou des parasites, 
generant un pouvoir pathogene et/ou antigenique, hebergee 

25 par une culture ou un hote vivant ; a titre d* exemple, une 
souche virale selon la definition precedente peut contenir 
un agent co-inf ectant , par exemple un protiste pathogene, 

- le terme "MSRV" utilise dans la presente 
description designe tout agent pathogene et/ou inf ectant, 

3 0 associe a la SEP, notamment une espece virale, les souches 
attenuees de ladite espece virale, ou les particules 
defectives interf erentes ou contenant des genomes co- 
encapsides ou encore des genomes recombines avec une 
partie du genome MSRV-1, derivees de cette espece. II est 

3 5 connu que les virus et particulierement les virus 
contenant de 1 1 ARN ont une variability, consecutive 
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notamment a des taux relat ivement eleves de mutation 
spontanee, dont il sera tenu compte ci-apres pour definir 
la notion d ' equivalence , 

- par virus humain, on entend un virus susceptible 
5 d'infecter ou d'etre heberge par 1 1 etre humain, 

- compte tenu de toutes les variations et/ou 
recombinaison naturelles ou induites, pouvant etre 
rencontrees dans la pratique de la present e invention , les 
objets de cette derniere, definis ci-dessus et dans les 

10 revendications , ont ete exprimes en comprenant les 
equivalents ou derives des differents materiels 
biologiques definis ci-apres , notamment des sequences 
homologues nucleotidiques ou peptidiques, 

- le variant d'un virus ou d 1 un agent pathogene 
15 et/ou infectant selon 1' invention, comprend au moins un 

antigene reconnu par au moins un anticorps dirige contre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogene et/ou infectant, et/ou un genome dont 
toute partie est detectee par au moins une sonde 
20 d ' hybridation, et/ou au moins une amorce d 1 amplif ication 
nucleotidique specif ique dudit virus et/ou agent pathogene 
et/ou infectant, dans des conditions d 1 hybridation 
determinees bien connues de 1 1 homme de l'art, 

- selon 1' invention, un fragment nucleotidique ou 
25 un oligonucleotide ou un polynucleotide est un 

enchainement de monomeres, ou un biopolymere, caracterise 
par la sequence inf ormationnelle des acides nucleiques 
naturels, susceptible de s'hybrider a tout autre fragment 
nucleotidique dans des conditions predeterminees , 

3 0 1 1 enchainement pouvant contenir des monomeres de 
structures chimiques differentes et etre obtenu a partir 
d'une molecule d'acide nucleique naturelle et/ou par 
recombinaison genet ique et/ou par synthese chimique ; un 
fragment nucleotidique peut etre identique a un fragment 

35 genomique du virus MSRV-l considere par la presente 
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invention, notamment un gene de ce dernier, par exemple 
pol ou env dans le cas dudit virus ; 

- ainsi un monomer e peut etre un nucleotide 
naturel d'acide nucleique, dont les elements const itutifs 

5 sont un sucre, un groupement phosphate et une base azotee; 
dans l'ARN le sucre est le ribose, dans 1 1 ADN le sucre est 
le desoxy-2-ribose; selon qu'il s'agit de 1 1 ADN ou l'ARN, 
la base azotee est choisie parmi 1' adenine, la guanine, 
I'uracile, la cytosine, la thymine; ou le nucleotide peut 

10 etre modifie dans l'un au moins des trois elements 
constitutifs ; a titre d' exemple, la modification peut 
intervenir au niveau des bases, generant des bases 
modifiees telles que l'inosine, la methyl-5- 

desoxycyt idine, la desoxyur idine , la 

15 dimethylamineo-5-desoxyur idine, la diamineo-2 , 6-purine , la 
bromo-5-desoxyuridine et toute autre base modifiee 
favor isant 1 1 hybridation; au niveau du sucre, la 
modification peut consister dans le remplacement d'au 
moins un desoxyribose par un polyamide, et au niveau du 

20 groupement phosphate, la modification peut consister dans 
son remplacement par des esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonate et 
de phosphorothioate , 

- par "sequence inf ormationnelle" , on entend toute 
25 suite ordonnee de monomeres, dont la nature chimique et 

1 1 ordre dans un sens de reference, constituent ou non une 
information f onctionnelle de meme qualite que celle des 
acides nucleiques naturels, 

- par hybridation, on entend le processus au cours 
30 duquel, dans des conditions operatoires appropriees, deux 

fragments nucleotidiques , ayant des sequences suf f isamment 
complementaires, s'apparient pour former une structure 
complexe, notamment double ou triple, de preference sous 
forme d'helice, 

3 5 - une sonde comprend un fragment nucleotidique 

synthetise par voie chimique ou obtenu par digestion ou 
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coupure enzymatique d'un fragment nucleot idique plus long, 
comprenant au moins six monomeres, avantageusement de 10 a 
100 monomeres, de preference 10 a 3 0 monomeres, et 
possedant une specif icite d ' hybridation dans des 
5 conditions determinees ; de preference, une sonde 
possedant moins de 10 monomeres n'est pas utilisee seule, 
mais 1 • est en presence d'autres sondes de taille aussi 
courte ou non ; dans certaines conditions particulieres , 
il peut etre utile d'utiliser des sondes de taille 
10 superieure a 100 monomeres ; une sonde peut notamment etre 
utilisee a des fins de diagnostic et il s'agira par 
exemple de sondes de capture et/ou de detection, 

- la sonde de capture peut etre immobilisee sur un 
support solide par tout moyen approprie, c'est-a-dire 

15 directement ou indirectement , par exemple par covalence ou 
adsorption passive , 

- la sonde de detection peut etre marquee au moyen 
d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 

20 peroxydase et la phosphatase alcaline et ceux susceptibles 
d'hydrolyser un substrat chromogene, fluorigene ou 
luminescent, des composes chimiques chromophores , des 
composes chromogenes, fluorigenes ou luminescents , des 
analogues de bases nucleot idiques , et la biotine, 

25 - les sondes utilisees a des fins de diagnostic de 

1 9 invention peuvent etre mises en oeuvre dans toutes les 
techniques d 9 hybridation connues, et notamment les 
techniques dites "DOT-BLOT", "SOUTHERN BLOT", "NORTHERN 
BLOT" qui est une technique identique a la technique 

30 "SOUTHERN BLOT" mais qui utilise de I'ARN comme cible, la 
technique SANDWICH ; avantageusement, on utilise la 
technique SANDWICH dans la presente invention, comprenant 
une sonde de capture specif ique et/ou une sonde de 
detection specif ique, etant entendu que la sonde de 

35 capture et la sonde de detection doivent presenter une 
sequence nucleotidique au moins partiellement differente, 
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- toute sonde selon la presente invention peut 
s'hybrider in vivo ou in vitro sur 1 1 ARN et/ou sur l'ADN, 
pour bloquer les phenomenes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledit 

5 ADN et/ou ARN, 

- une amorce est une sonde comprenant au moins six 
monomeres, et avantageusement de 10 a 3 0 monomeres , 
possedant une specif icite d 1 hybridation dans des 
conditions determinees , pour 1 1 initiation d'une 

10 polymerisation enzymatique, par exemple dans une technique 
d' amplification telle que la PCR (Polymerase Chain 
Reaction), dans un procede d • elongation , tel que le 
sequengage, dans une methode de transcription inverse ou 
analogue , 

15 - deux sequences nucleotidiques ou peptidiques 

sont dites equivalentes ou derivees 1 1 une par rapport a 
1' autre, ou par rapport a une sequence de reference, si 
f onctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le meme role, sans etre identiques, 

20 vis-a-vis de 1 1 application ou utilisation consideree, ou 
dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 
la variabilite naturelle, notamment mutation spontanee de 
1 ' espece a partir de laquelle elles ont ete identifiees, 

25 ou induite, ainsi que deux sequences homologues, 
l'homologie etant definie ci-apres, 

- par "variabilite", on entend toute modification, 
spontanee ou induite d'une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 

30 nucleotides et/ou de fragments nucleotidiques, et/ou 
extension et/ou racourcissement de la sequence a l'une au 
moins des extremites; une variabilite non naturelle peut 
resulter des techniques de genie genetique utilisees, par 
exemple du choix des amorces de synthese degenerees ou 

3 5 non, retenues pour amplifier un acide nucleique; cette 
variabilite peut se traduire par des modifications de 
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toute sequence de depart, consideree comme reference, et 
pouvant etre exprimees par un degre d'homologie par 
rapport a ladite sequence de reference, 

- I'homologie caracterise le degre d'identite de 
5 deux fragments nucleotidiques ou peptidiques compares ; 
elle se mesure par le pourcentage d'identite qui est 
notamment determine par comparaison directe de sequences 
nucleoditiques ou peptidiques, par rapport a des sequences 
nucleotidiques ou peptidiques de reference, 

10 - tout fragment nucleotidique est dit equivalent 

ou derive d'un fragment de reference, s'il presente une 
sequence nucleotidique equivalente a la sequence du 
fragment de reference ; selon la definition precedente, 
sont notamment equivalents a un fragment nucleotidique de 

15 reference : 

(a) tout fragment susceptible de s'hybrider au 
moins partiellement avec le complement du fragment de 
reference, 

(b) tout fragment dont l'alignement avec le 
20 fragment de reference conduit a mettre en evidence des 

bases contigues identiques , en nombre plus important 
qu ' avec tout autre fragment provenant d'un autre groupe 
taxonomique , 

(c) tout fragment resultant ou pouvant resulter de 
25 la variability naturelle de l'espece, a partir de laquelle 

il est obtenu, 

(d) tout fragment pouvant resulter des techniques 
de genie genetique appliquees au fragment de reference, 

(e) tout fragment, comportant au moins huit 
3 0 nucleotides contigus, codant pour un peptide homologue ou 

identique au peptide code par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, deletion, substitution d'au 
moins un monomere, extension, ou raccourcissement a l'une 

3 5 au moins de ses extremites ; par exemple, tout fragment 
correspondant au fragment de reference, flanque a l'une au 
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moins de ses extremites par une sequence nucleotidique ne 
codant pas pour un polypeptide , 

- par polypeptide, on entend notamment tout 
peptide d 1 au moins deux acides aminees, notamment 

5 oligopeptide, proteine, extrait, separe, ou 

substantiellement isole ou synthetise, par 1 • intervention 
de la main de l'homme, notamment ceux obtenus par synthese 
chimique, ou par expression dans un organisme recombinant , 

- par polypeptide code de maniere partielle par un 
10 fragment nucleotidique , on entend un polypeptide 

presentant au moins trois acides aminees codes par au 
moins neuf monomeres contigus compris dans ledit fragment 
nucleotidique , 

- un acide aminee est dit analogue a un autre 
15 acide aminee, lorsque leur caracter istiques physico- 

chimiques respectives , telles que polarite , 

hydrophobicite, et/ou basicite, et/ou acidite, et/ou 
neutrality, sont sensiblement les memes ; ainsi, une 
leucine est analogue a une isoleucine. 

20 - tout polypeptide est dit equivalent ou derive 

d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes proprietes, et 
notamment les memes proprietes ant igeniques , 

immunologiques, enzymologiques et/ou de reconnaissance 

25 moleculaire ; est notamment equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide aminee a ete substitue par un acide 
aminee analogue, 
30 (b) tout polypeptide ayant une sequence peptidique 

equivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de reference, et/ou du fragment 
nucleotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de reference, 
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(d) tout polypeptide dans la sequence duquel un ou 
plusieurs acides aminees de la serie L sont remplaces par 
un acide aminee de la serie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
5 introduit une modification des chaines laterales des 

acides aminees, telle que par exemple une acetylation des 
fonctions aminees, une carboxylation des fonctions thiol, 
une esterif ication des fonctions carboxyliques , 

(f) tout polypeptide dans la sequence duquel une 
10 ou des liaisons peptidiques ont ete modifiees, comme par 

exemple les liaisons carba , retro, inverso, retro-inverso , 
reduites, et methylene-oxy , 

(g) tout polypeptide dont au moins un antigene est 
reconnu par anticorps dirige contre un polypeptide de 

15 reference, 

- le pourcentage d'identite caracterisant 
l'homologie de deux fragments peptidiques compares est 
selon la presente invention d'au moins 50% et de 
preference au moins 70 %. 

20 Etant donne qu 1 un virus possedant une activite 

enzymatique transcriptase inverse peut etre genetiquement 
caracterise aussi bien sous forme d'ARN que d'ADN, il sera 
fait mention aussi bien de I'ADN que de 1 1 ARN viral pour 
caracteriser les sequences relatives a un virus possedant 

25 une telle activite transcriptase inverse, dit MSRV-1 selon 
la presente description* 

Les expressions d 1 ordre utilisees dans la presente 
description et les revendications, telles que "premiere 
sequence nucleotidique" ne sont pas retenues pour exprimer 

30 un ordre particulier, mais pour definir plus clairement 
1 ' invention. 

Par detection d'une substance ou agent, on entend 
ci-apres aussi bien une identification, qu'une 
quantification, ou une separation ou isolement de ladite 
3 5 substance ou dudit agent. 
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L' invention sera mieux comprise a la lecture de la 
description detaillee qui va suivre faite en reference aux 
figures annexees dans lesquelles : 

La Figure 1 represente la structure generale de 
5 I'ADN proviral et l'ARN genomique de MSRV-1. 

La Figure 2 represente la sequence nucleotidique 
du clone denomme CL6-5 1 (SEQ ID NO: 112) et trois trames 
de lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique . 
10 La Figure 3 represente la sequence nucleotidique 

du clone denomme CL6-3 ' (SEQ ID NO: 114) et trois trames 
de lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique . 

La Figure 4 represente la sequence nucleotidique 
15 du clone denomme C15 (SEQ ID NO: 117) et trois trames de 
lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique . 

La Figure 5 represente la sequence nucleotidique 
du clone denomme 5M6 (SEQ ID NO: 12 0) et trois trames de 
20 lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique. 

La Figure 6 represente la sequence nucleotidique 
du clone denomme CL2 (SEQ ID NO: 13 0) et trois trames de 
lecture potentielles en acides aminees figurant sous la 
25 sequence nucleotidique. 

La Figure 7 represente trois trames de lecture 
potentielles en acides aminees exprimees par pET28C-clone 
2 et figurant sous la sequence nucleotidique. 

La Figure 8 represente trois trames de lecture 
30 potentielles en acides aminees exprimees par pET21C-clone 
2 et figurant sous la sequence nucleotidique. 

La Figure 9 represente la sequence nucleotidique 
du clone denomme LB13 (SEQ ID NO: 141) et trois trames de 
lecture potentielles en acides aminees figurant sous la 
35 sequence nucleotidique. 
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La Figure 10 represente la sequence nucleotidique 
du clone denomme LA15 (SEQ ID NO: 142) et trois trames de 
lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique. 
5 La Figure 11 represente la sequence nucleotidique 

du clone denomme LB16 (SEQ ID NO: 124) et trois trames de 
lecture potentielles en acides aminees figurant sous la 
sequence nucleotidique . 

La Figure 12 represente l'activite promotrice 

10 exprimee en cpm/4min des sequences U3R sous donees a 
partir de LTRs d'origines dif ferentes dans le plasmide 
PC AT 3 . PCAT3 signifie plasmide seul, PCAT-PH74 signifie 
plasmide plus clone U3Rendogene exprime dans le placenta, 
PCAT— cl6 signifie plasmide plus clone U3R amplifie dans 

15 1 • ARN d'un plasma SEP, PCAT-5M6 signifie plasmide plus 
region U3R amplifiee dans 1 1 ADN cellulaire, "no plasmid" 
signifie absence de plasmide dans le test. 

La Figure 13 represente les sequences MSRV1 env et 
LTR3 1 . Les f leches horizontales indiquent le debut des 

20 regions env, U3 et R. Dans la region env : le peptide 
signal et la region immunosuppressive potentielle sont 
soulignes, les sites de glycosilation potentiels sont 
encadres et les sites de clivage potentiels sont indiques 
par des f leches verticales. Dans la region U3R : 1 ! element 

25 de regulation CAAT et la TATA Box sont soulignes, le site 
"cap" et le signal de polyadenylation sont aussi indiques. 

La Figure 14 represente une region LTRS 1 (RU5) 
suivie d'un site PBS (primer binding site) complementaire 
du tARN Trp et d'un gene gag codant pour une proteine 

30 d ' environ 487 acides amines. Les acides amines conserves 
dans la nucleocapside sont soulignes deux fois. Les acides 
amines definissant la region de plus forte homologie dans 
la capside sont en gras et soulignes une fois. Les / dans 
la sequence en acides amines indiquent des variations 

35 observees selon les clones et dans la sequence 
nucleotidique ils indiquent des sauts de trame dans 
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certains clones. Les regions encadrees correspondent a des 
epitopes identifies par analyse peptidique de la region C- 
terminale. 

La Figure 15 represente la region integrase de 
5 MSRV1, la sequence nucleot idique et la sequence en acides 
amines deduite de la region integrase correspondant au 
clone 87-23. Dans la Figure 15 // signifie un saut de 
trame qui a ete supprime pour restituer l'ORF potentiel. 
Les lettres en caracteres gras soulignees representent les 
10 acides amines conserves des integrases retrovirales . 

La Figure 16 decrit les sequences nucleot idique et 
peptidique du clone B13 (identique au clone FBdl3 decrit 
dans des demandes anterieures) avec indication des ORFs et 
des codons stop representes par un point. La region 
15 soulignee en gras represente le domaine immunosuppresseur 
potentiel, Le domaine souligne en simple represente le 
debut du LTR3 • . 

EXEMPLE 1 ; OBTENTION D 1 UNE REGION CL6-5 1 CODANT POUR 
2 0 L • EXTREMITE N-TERMINALE DE L 1 INTEGRASE ET D 1 UNE REGION 
CL6-3 1 CONTENANT LA SEQUENCE 3 1 TERMINALE DU GENOME MSRV-1 

Une 3' RACE a ete effectuee sur de 1 1 ARN total 
extrait de plasma d'un patient atteint de SEP. Un plasma 

25 temoin sain, traite sous les memes conditions, a ete 
utilise comme controle negatif. La synthese de cDNA a ete 
realisee avec une amorce oligo dT identifiee par 
SEQ ID NO: 68 (5' GAC TCG CTG CAG ATC GAT TTT TTT TTT TTT 
TTT T 3') et la transcriptase inverse "Expand™ RT" de 

30 Boehringer selon les conditions preconisees par la 
societe. Une PCR a ete effectuee avec l 1 enzyme Klentaq 
(Clontech) sous les conditions suivantes : 94 °C 5 min puis 
93 °C 1 min, 58 °C 1 min, 68 °C 3 min pendant 40 cycles et 
68°C pendant 8 min, avec un volume reactionnel final de 

35 50 /xl. 

Amorces utilisees pour la PCR: 
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- amorce 5 1 , identifiee par SEQ ID NO: 69 

5 1 GCC ATC AAG CCA CCC AAG AAC TCT TAA CTT 3 1 ; 

- amorce 3 1 , identifiee par SEQ ID NO: 68 

Une deuxieme PCR dite "semi-nichee" a ete 
5 realisee avec une amorce 5' situee a I'interieur de la 
region deja amplif iee. Cette deuxieme PCR a ete effectuee 
sous les memes conditions experimentales que celles 
utilisees lors de la premiere PCR, en utilisant 10 jul du 
produit d ' amplification issu de la premiere PCR. 
10 Amorces utilisees pour la PCR semi-nichee: 

- amorce 5', identifiee par SEQ ID NO: 70 

5 ■ CCA ATA GCC AGA CCA TTA TAT ACA CTA ATT 3 1 ; 

- amorce 3', identifiee par SEQ ID NO: 68 

Les amorces SEQ ID NO: 69 et SEQ ID NO: 70 sont 

15 specif iques de la region pol de MSRV-1. 

Un produit d 1 amplif ication de 1,9Kb a ete obtenu 
pour le plasma de patient SEP. Le fragment correspondant 
n'a pas ete observe pour le plasma temoin sain. Ce produit 
d ' amplif ication a <§te clone de la fatpon suivante : 

20 l'ADN amplif ie a ete insere dans un plasmide a I 1 aide du 
kit TA Cloning®. Les 2 ^1 <3e solution d 1 ADN ont ete 
melanges avec 5 /xl d'eau distillee sterile, 1/xl d'un 
tampon de ligation 10 fois concentre "10X LIGATION 
BUFFER", 2 Ml de "pCR™ VECTOR" (25 ng/ml) et 1 /xl de "T4 

25 DNA LIGASE" . Ce melange a ete incube une nuit a 12 °C. Les 
etapes suivantes ont ete realisees conformement aux 
instructions du kit TA Cloning® (Invitrogen) . A la fin de 
la procedure, les colonies blanches de bacteries 
recombinantes (white) ont ete repiquees pour etre 

30 cultivees et permettre 1' extraction des plasmides 
incorpores selon la procedure dite de "miniprep" . La 
preparation de plasmide de chaque colonie recombinante a 
ete coupee par une enzyme de restriction appropriee et 
analysee sur gel d* agarose. Les plasmides possedant un 

3 5 insert detecte sous lumiere UV apres marquage du gel au 
bromure d'ethidium, ont ete selectionnes pour le 
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sequencpage de l f insert, apres hybridation avec une amorce 
complement a ire du promoteur Sp6 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prealable au 
sequen<?age a ensuite ete effectuee selon la methode 
5 preconisee pour 1 • utilisation du kit de sequengage 
"PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 
Terminator" (Applied Biosystems, ref . 402119) et le 
sequengage automatique a ete realise sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 

10 fabricant. 

Le clone obtenu, contient une region CL6-5'codant 
pour l'extremite N terminale de I'integrase et une region 
CL6-3 1 , correspondant a la region 3 1 terminale de MSRV-1 
et permettant de definir la fin de 1 1 enveloppe (234 pb) et 

15 les regions U3 , R (401 pb) du retrovirus MSRV1. 

La region correspondant a 1 1 extremite N terminale 
de 1 1 integrase est representee par sa sequence 
nucleotidique (SEQ ID NO: 112) dans la figure 27. Les 
trois trames de lecture potentielles sont presentees par 

20 leur sequence amineoacide sous la sequence nucleotidique, 
et la sequence amineoacide de l'extremite N-terminale de 
I'integrase est identifiee par SEQID NO: 113. 

La region C16-3 1 est representee par sa sequence 
nucleotidique (SEQ ID NO: 114) dans la figure 3, Les trois 

2 5 trames de lecture potentielles sont presentees par leur 
sequence amineoacide sous la sequence nucleotidique. Une 
sequence amineoacide correspondant a l'extremite 
C-terminale de la proteine env de MSRV-1 est identifiee 
par SEQ ID NO: 115. 

30 Afin d'evaluer 1'activite promotrice du LTR obtenu 

a partir de clone 6 (cl6) un test d'activite promotrice 
utilisant 1' enzyme CAT (chloramphenicol acetyl 
transferase) a ete effectue avec la region U3R 
correspondante . En parallele un clone contenant la meme 

35 region U3R d'ARN retroviral endogene exprime dans le 
placenta normal (PH74) et un clone (5M6) provenant d'ADN 
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ont ete testes. Le resultat presente dans la figure 12 
montre une tres forte activite promotrice du LTR issu de 
plasma SEP (cl6) et une activite signif icativement 
beaucoup plus faible avec les sequences d'origine endogene 
5 non SEP . 

EXEMPLE 2 : OBTENTION DU CLONE CI 5 CONTENANT LA REGION 
CODANT POUR UNE PART I E DE L 1 ENVELOPPE DU RETROVIRUS MSRV-1 

10 Une RT-PCR a ete effectuee sur de 1 1 ARN total 

extrait de virions concentres par ultracentrif ugat ion a 
partir d'un surnageant de culture de synoviocytes 
provenant d'un patient PR. La synthese de cDNA a ete 
realisee avec une amorce oligo dT et la transcriptase 

15 inverse "Expand™ RT" de Boehringer selon les conditions 
preconisees par la societe. Une PCR a ete effectuee avec 
1 1 Expand™ Long Template PCR System (Boehringer) sous les 
conditions suivantes : 94 °C 5 min puis 93 °C 1 min, 60°C 1 
min, 68°C 3 min pendant 40 cycles et 68°C pendant 8 min et 

20 avec un volume reactionnel final de 50 /il. 
Amorces utilisees pour la PCR: 

- amorce 5 1 , identifiee par SEQ ID NO: 69 

5 • GCC ATC AAG CCA CCC AAG AAC TCT TAA CTT 3 1 ; 

- amorce 3', identifiee par SEQ ID NO: 116 

25 5' TGG GGT TCC ATT TGT AAG ACC ATC TGT AGC TT 3' 

Une deuxieme PCR dite "semi-nichee" a ete 
realisee avec une amorce 5 1 situee a l'interieur de la 
region deja amplifiee. Cette deuxieme PCR a ete effectuee 
sous les memes conditions exper imentales que celles 

30 utilisees lors de la premiere PCR (sauf que 30 cycles ont 
ete realises au lieu de 40) , en utilisant 10 /xl du produit 
d 1 amplification issu de la premiere PCR. 
Amorces utilisees pour la PCR semi-nichee: 

- amorce 5', identifiee par SEQ ID NO: 70 

3 5 5 1 CCA ATA GCC AGA CCA TTA TAT ACA CTA ATT 3 f ; 

- amorce 3', identifiee par SEQ ID NO: 116 
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Les amorces SEQ ID NO : 69 et SEQ ID NO : 7 0 sont 
specif iques de la region pol de MSRV-1. L 1 amorce SEQ ID 
NO: 116 est specif ique de la sequence FBdl3 (aussi denomme 
B13) et est localisee dans la region env conservee parmi 
5 les oncoretrovirus . 

Un produit d 1 amplification de 1932 pb a ete 
obtenu et clone de la fa<?on suivante : 

l'ADN amplifie a ete insere dans un plasmide a l'aide du 
kit TA Cloning®, Les differentes etapes ont ete realisees 

10 conformement aux instructions du kit TA Cloning® 
(Invitrogen) . A la fin de la procedure, les colonies 
blanches de bacteries recombinantes (white) ont ete 
repiquees pour etre cultivees et permettre 1* extraction 
des plasmides incorpores selon la procedure dite de 

15 "miniprep" . La preparation de plasmide de chaque colonie 
recombinante a ete coupee par une enzyme de restriction 
appropriee et analysee sur gel d 1 agarose. Les plasmides 
possedant un insert detecte sous lumiere UV apres marquage 
du gel au bromure d'ethidium, ont ete select ionnes pour le 

20 sequengage de 1' insert , apres hybridation avec une amorce 
complementaire du promoteur SP6 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prealable au 
sequengage a ensuite ete ef fectuee selon la methode 
preconisee pour 1 ' utilisation du kit de sequengage 

2 5 "PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 
Terminator" (Applied Biosystems, ref. 402119) et le 
sequengage automatique a ete realise sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 
f abricant . 

30 Le clone C15 obtenu, contient une region 

correspondant a la region de I'enveloppe de MSRV-1, de 
1481 pb. 

La region env du clone C15 est representee par sa 
sequence nucleotidique (SEQ ID NO: 117) dans la figure 5. 
35 Les trois trames de lecture potentielles de ce clone sont 
presentees par leur sequence amineoacide sous la sequence 
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nucleotidique . La trame de lecture correspondant a une 
proteine env structurale MSRV-1 est identifiee par 
SEQ ID NO: 118. 

A partir des sequences definies provenant des 
5 clones cl6 et C15, une construction plasmidique a pu etre 
effectuee codant pour une enveloppe complete suivie du 
LTR3 • , comme presente dans la figure 13 avec la trame de 
lecture correspondante . 

10 EXEMPLE 3 : OBTENTION D 1 UN CLONE 5M6 CONTENANT LES 
SEQUENCES DE LA REGION 3' TERMINALE DE L 1 ENVELOPPE, 
SUIVIES DES SEQUENCES U3,R,U5 DE TYPE PROVIRAL MSRV-1. 

Une PCR monodirectionnelle a ete effectuee sur de 
15 1 • ADN extrait de lymphocytes B immortalises en culture 
d'un patient PR. La PCR a ete effectuee avec 1 1 Expand™ 
Long Template PCR System (Boehringer) sous les conditions 
suivantes : 94°C 3 min puis 93°C 1 min, 60°C 1 min, 68°C 3 
min pendant 10 cycles , puis 93 °C 1 min, 60°C 1 min avec 
20 15 sec d' extension a chaque cycle, 68 °C 3 min pendant 35 
cycles et 68 °C pendant 7 min et avec un volume reactionnel 
final de 50 fil . 

L' amorce utilisee pour la PCR identifiee par 
SEQ ID NO: 119 est 5' TCA AAA TCG AAG AGC TTT AGA CTT GCT 
25 AAC CG 3 ' ; 

L' amorces SEQ ID NO: 119 est specif ique de la region env 
du clone C15. 

Un produit d 1 amplification de 1673 pb a ete 
obtenu et clone de la fagon suivante : 

30 1 'ADN amplifie a ete insere dans un plasmide a l'aide du 
kit TA Cloning®. Les differentes etapes ont ete realisees 
conformement aux instructions du kit TA Cloning® 
(Invitrogen) . A la fin de la procedure, les colonies 
blanches de bacteries recombinantes (white) pnt ete 

35 repiquees pour etre cultivees et permettre 1* extraction 
des plasmides incorpores selon la procedure dite de 
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"miniprep" . La preparation de plasmide de chaque colonie 
recombinante a ete coupee par une enzyme de restriction 
appropriee et analysee sur gel d 1 agarose. Les plasmides 
possedant un insert detecte sous lumiere UV apres marquage 
5 du gel au bromure d'ethidium, ont ete selectionnes pour le 
sequengage de l f insert, apres hybridation avec une amorce 
complementaire du promoteur T7 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prealable au 
sequenqage a ensuite ete effectuee selon la methode 

10 preconisee pour 1 1 utilisation du kit de sequengage 
"PRISM™ Ready Reaction AmpliTaq® FS , DyeDeoxy™ 
Terminator" (Applied Biosystems, ref . 402119) et le 
sequen?age automatique a ete realise sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 

15 fabricant, 

Le clone 5M6 obtenu, contient une region 
correspondant a la region 3 f de l'enveloppe de MSRV-1, de 
492 pb suivi des regions U3 , R et U5 (837 pb) de MSRV1. 

Le clone 5M6 est represents par sa sequence 

20 nucleotidique (SEQ ID NO: 120) dans la figure 5. Les trois 
trames de lecture potentielles de ce clone sont presentees 
par leur sequence amineoacide sous la sequence 
nucleotidique. La trame de lecture correspondant a 
l'extremite C-terminale de la proteine env MSRV-1 est 

25 identifiee par SEQ ID NO: 121. 

EXEMPLE 4 : OBTENTION DU CLONE LB16 CONTENANT LA REGION 
CODANT L ' INTEGRASE DU RETROVIRUS MSRV-1 

Une RT-PCR a ete effectuee sur de 1 1 ARN total 

30 traite a la DNAsel et extrait a partir d'un plexus 
choroide provenant d'un patient SEP. La synthese de cDNA a 
ete realis^e avec une amorce oligo dT et la transcriptase 
inverse "Expand™ RT" de Boehringer selon les conditions 
preconisees par la societe. Un controle "no RT" a ete 

35 effectue parallelement sur le meme materiel. Une PCR a ete 
effectuee avec la Taq polymerase (Perkin Elmer) sous les 
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conditions suivantes : 95°C 5 min puis 95°C 1 min, 55°C 1 

min, 72°C 2 min pendant 35 cycles et 72°C pendant 8 min et 

avec un volume reactionnel final de 50 /xl* 

Amorces utilisees pour la PCR: 
5 - amorce 5', identifiee par SEQ ID NO: 122 

5 ■ GGC ATT GAT AGC ACC CAT CAG 3 1 ; 

- amorce 3', identifiee par SEQ ID NO: 123 

5 ■ CAT GTC ACC AGG GTG GAA TAG 3 1 

L f amorce SEQ ID NO: 122 est specif ique de la 
10 region pol de MSRV-1 et plus precisement similaire a la 

region integrase decrite precedement. L 1 amorce 

SEQ ID NO 123 a ete definie sur des sequences des clones 

obtenus lors d'essais prealables. 

Un produit d 1 amplification d' environ 760 pb a ete 
15 obtenu uniquement dans l'essai avec RT et a ete clone de 

la fagon suivante : 

l'ADN amplifie a ete insere dans un plasmide a l'aide du 
kit TA Cloning®. Les dif ferentes etapes ont ete realisees 
conformement aux instructions du kit TA Cloning® 

20 (Invitrogen) . A la fin de la procedure, les colonies 
blanches de bacteries recombinantes (white) ont ete 
repiquees pour etre cultivees et permettre l 1 extraction 
des plasmides incorpores selon la procedure dite de 
"miniprep" . La preparation de plasmide de chaque colonie 

25 recombinante a ete coupee par une enzyme de restriction 
appropriee et analysee sur gel d' agarose. Les plasmides 
possedant un insert detecte sous lumiere UV apres marquage 
du gel au bromure d'ethidium, ont ete selectionnes pour le 
sequen?age de 1' insert, apres hybridation avec une amorce 

30 complementaire du promoteur T7 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prealable au 
sequengage a ensuite ete effectuee selon la methode 
preconisee pour 1 1 utilisation du kit de sequen<?age 
"PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 

35 Terminator" (Applied Biosystems, ref. 402119) et le 
sequengage automatique a ete realise sur les appareils 
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373 A et 377 Applied Biosystems, selon les instructions du 
f abricant • 

Le clone LB16 obtenu, contient les sequences 
correspondant a l'integrase. La sequence nucleotidique de 
5 ce clone est identifiee par SEQ ID NO: 124 sur la figure 
11, trois trames de lecture sont determinees. 

EXEMPLE 5 : OBTENTION D « UN CLONE 2, CL2 , CONTENANT EN 

3' UNE PART IE HOMOLOGUE AU GENE POL, CORRESPONDANT AU GENE 
10 PROTEASE, ET AU GENE GAG (GM3) CORRESPONDANT A LA 
NUCLEOCAPSIDE , ET UNE NOUVELLE REGION 5 1 CODANTE , 
CORRESPONDANT AU GENE GAG PLUS SPECIFIQUEMENT LA MATRICE 
ET LA CAPSIDE de MSRV-1. 



15 une amplification par PCR a ete effectuee sur de 

1 1 ARN total extrait a partir de 100 /zl de plasma d 1 un 
patient atteint de SEP. Un temoin eau, traite sous les 
memes conditions, a ete utilise comme controle negatif. La 
synthese de cDNA a ete realisee avec 300 pmole d'une 

20 amorce aleatoire (GIBCO-BRL, France) et la transcriptase 
inverse "Expand RT" (BOEHRINGER MANNHEIM, France) selon 
les conditions preconisees par la societe. Une 
amplification par PCR (" polymerase chain reaction ") a 
ete effectuee avec 1' enzyme Taq polymerase (Perkin Elmer, 

25 France) en utilisant 10 /zl de cDNA sous les conditions 
suivantes: 94°C 2 min, 55°C 1 min, 72°C 2 min puis 94°C 
1 min, 55°C 1 min, 72°C 2 min pendant 30 cycles et 72°C 
pendant 7 min et avec un volume reactionnel final de 

50 Ml- 

30 Amorces utilisees pour 1 1 amplification par PCR: 

- amorce 5', identifiee par SEQ ID NO: 126 
5 • CGG ACA TCC AAA GTG ATG GGA AAC G 3 1 ; 

- amorce 3', identifiee par SEQ ID NO: 127 

5 1 GGA CAG GAA AGT AAG ACT GAG AAG GC 3 • 

35 une deuxieme amplification par PCR dite "seitii- 

nichee" a ete realisee avec une amorce 5 1 situee a 
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l'interieur de la region deja amplif iee. Cette deuxieme 
PCR a ete ef fectuee sous les memes conditions 
experimentales que celles utilisees lors de la premiere 
PCR, en utilisant 10 fil du produit d 1 amplif ication issu de 
5 la premiere PCR. 

Amorces utilisees pour 1 1 amplif ication par PCR semi- 
nichee : 

- amorce 5", identifiee par SEQ ID NO: 128 

5 1 CCT AGA ACG TAT TCT GGA GAA TTG GG 3 1 ; 
10 - amorce 3', identifiee par SEQ ID NO: 129 

5 ' TGG CTC TCA ATG GTC AAA CAT ACC CG 3 ' 

Les amorces SEQ ID NO: et SEQ ID NO: sont 

specif iques de la region pol, clone G+E+A, plus 

specif iquement la region E: position nucleotidique n° 423 
15 a n° 448. Les amorces utilisees dans la region 5 f ont ete 

definies sur des sequences de clones obtenus lors d'essais 

prealables. 

Un produit d 1 amplif ication de 1511 pb a ete 
obtenu a partir de l'ARN extrait du plasma de patient SEP. 

20 Le fragment correspondant n'a pas ete observe pour le 
temoin eau. Ce produit d 1 amplif ication a ete clone de la 
fa^on suivante. 

L'ADN amplifie a ete insere dans un plasmide a 
l'aide du kit TA Cloning™. Les 2 fil de solution d'ADN ont 

25 ete melanges avec 5 Ml d 1 eau distillee sterile, 1 /xl d'un 
tampon de ligation 10 fois concentre " 10X LIGATION 
BUFFER", 2 Ml "pCR™ VECTOR" (25 ng/ml) et 1 /xl de "T4 

DNA LIGASE". Ce melange a ete incube une nuit a 14 °C. Les 
etapes suivantes ont ete realisees conformement au 

30 instructions du kit TA Cloning® (Invitrogen) . Le melange a 
ete etale apres transformation de la ligation dans des 
bacteries E. coli INVaF ' . A la fin de la procedure, les 
colonies blanches de bacteries recombinantes ont ete 
repiquees pour etre cultivees et permettre 1' extraction 

35 des plasmides incorpores selon la procedure dite de 
"minipreparation d^DN" (17). La preparation de plasmide 
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de chaque colonie recombinants a ete coupee par 1 1 enzyme 
de restriction Eco RI et analysee sur gel d 1 agarose. Les 
plasmides possedant un insert detecte sous lumiere UV 
apres marquage du gel au bromure d'ethidium, ont ete- 
5 selectionnes pour le sequen<?age de l f insert, apres 
hybridation avec une amorce complementaire du promoteur T7 
present sur le plasmide de clonage du TA cloning kit®. La 
reaction prealable au sequengage a ensuite ete effectuee 
selon la methode preconisee pour 1 1 utilisation du kit de 

TM 

10 sequengage "PRISM Ready Reaction Amplitaq® FS, 

TM 

DyeDeoxy Terminator" (Applied Biosystems, ref . 402119) 
et le sequengage automatique a ete realise sur les 
appareils 373 A et 377 Applied Biosystems, selon les 
instructions du f abr icant . 

15 Le clone obtenu, denomme CL2 , contient une region 

C-terminale similaire a la region 5' terminale des clones 
G+E+A de MSRV-1, qui permet de definir la region C- 
terminale du gene gag et une nouvelle region 
correspondante a la region N-terminale du gene gag MSRV-1. 

20 CL2 permet de definir une region de 1511 pb 

presentant une phase ouverte de lecture dans la region N- 
terminale de 107 7 pb codante pour 3 59 acides aminees et 
une phase non-ouverte de lecture, de 4 54 pb, correspondant 
a la region C-terminale du gene gag MSRV-1. 

25 La sequence nucleotidique de CL2 est identifiee 

par SEQ ID NO: 13 0. Elle est representee a la figure 6, 
avec les trames de lecture potentielles en amineoacide. 

Le fragment de 1077 pb de CL2 codant pour 3 59 
acides amines a ete amplifie par PCR avec 1* enzyme Pwo 

30 (5U/M1) (Boehringer Mannheim, France) en utilisant 1 Ml 

la minipreparation de l'ADN du clone 2 sous les conditions 
suivantes : 95°C 1 min, 60°C 1 min, 72°C 2 min pendant 25 
cycles et avec un volume react ionnel final de 50 m 1 a 
l'aide des amorces: 

35 - amorce 5* (Bam HI), identifie par SEQ ID NO: 132 
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5 1 TGC TGG AAT TCG GGA TCC TAG AAC GTA TTC 3' (30 mer) , et 

- amorce 3' (Hind III), identifie par SEQ ID NO: 133 

5 AGT TCT GCT CCG AAG CTT AGG CAG ACT TTT 3' (30 mer) 

correspondant, respect ivement ,. a la sequence nucleotidique 

5 du clone 2 en position -9 a 21 et 1066 a 1095. 

Le fragment obtenu apres PCR, a ete linearise par 

Bam HI et Hindlll et sous-clone dans les vecteurs 

d' expression pET28C et pET21C (NOVAGEN) linearise par Ba/n 

HI et Hind III. Le sequengage de 1 1 ADN du fragment de 1077 

10 pb du clone 2 dans les deux vecteurs d 1 expression a ete 

realise selon la methode preconisee pour 1 1 utilisation du 

TM 

kit de sequenqage "PRISM Ready Reaction Amplitaq® FS , 

TM . . 

DyeDeoxy Terminator" (Applied Biosystems, ref . 402119) 

et le sequengage automatique a ete realise sur les 
15 appareils 373 A et 377 Applied Biosystems, selon les 

instructions du fabricant. 

L 1 expression de la sequence nucleotidique du 

fragment de 1077 pb du clone 2 par les vecteurs 

d* expression pET28C et pET21C sont identifiees par 
20 respectivement SEQ ID NO: 135 et SEQ ID NO: 137. 

EXEMPLE 6 : EXPRESSION DU CLONE 2 CHEZ ESCHERICHIA COLI 

Les constructions pET28c-clone 2 (1077 pb) et 
25 pET21C-clone 2 (1077 pb) synthetisent , dans la souche 
bacterienne BL21 (DE3) , une proteine en fusion N- et C- 
terminale pour le vecteur pET28C et C-Terminale pour le 
vecteur pET21C avec 6 Histidines, de masse moleculaire 
apparente d 1 environ 4 5 kDa, mise en evidence par 
30 electrophorese sur gel de polyacrylamide SDS-PAGE (SDS = 
Dodecyl Sulfate de Sodium) (Laemmli, 1970 (1)). La 
reactivite de la proteine a ete mise en evidence vis a vis 
d'un anticorps monoclonal anti-Histidine (DIANOVA) par la 
technique de Western blot (Towbin et al., 1979 (2)). 
35 Les proteines recombinantes pET28c-clone 2 

(1077 pb) et pET21C-clone 2 (1077 pb) ont ete visualisees 
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en SDS-PAGE dans la fraction insoluble apres digestion 
enzymatique des extraits bacteriens avec 50 fxl de lysozyme 
(10 mg/ml) et lyse par ultrasons. 

Les proprietes antigeniques des antigenes 
5 recombinants pET28C-clone 2 (1077 pb) et pET21C-clone 2 
(1077 pb) ont ete testees par Westen Blot () apres 
solubilisation du culot bacterien avec 2% SDS et 50 mM (3- 
xnercaptoethanol . Apres incubation avec les serums de 
patients atteints de sclerose en plaques, les serums des 
10 temoins neurologiques et les serums de temoins de centre 
de transfusion sanguine (CTS) , les immunocomplexes ont ete 
detectes a l'aide d'un serum de chevre anti-IgG et anti 
IgM humaines, couple a la phosphatase alcaline. 

Les resultats sont presentes dans le tableau ci- 

15 apres, 

TABLEAU 

Reactivite de serums atteints de sclerose en plaques et 
temoins avec la proteine recombinante MSRV-1 gag clone 2 
(1077 pb) = pET21C-clone 2 (1077 pb) et pET28C-clone 2 
20 (1077 pb) a 

MALADIE NOMBRE NOMBRE 

D'INDIVIDUS TESTES D ' INDIVIDUS PQSITIFS 

SEP 15 6 

25 2 (+++) , 2 (++) , 2 ( + ) 
TEMOINS 

NEUROLOGIQUES 2 1 ( +++ ) 

TEMOINS 

SAINS (CTS) 22 1(+/-) 



30 



(a) Les bandelettes contenant 1,5 jig d*antigene 
recombinant pET-gag clone 2 (1077 pb) presentent une 
reactivite contre de serums dilues au 1/100. 
L f interpretation de Western Blot est basee sur la presence 
3 5 ou absence d'une bande pET-gag clone 2 (1077 pb) 
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specif ique sur les bandelettes. Des controles positifs et 
negatifs sont inclus dans chaque experience. 

Ces resultats montrent que, dans les conditions 
5 techniques utilisees, environ 4 0% des serums humains 
atteints de sclerose en plaques testes reagissent avec les 
proteines recombinantes pET28C-clone 2 (1077 pb) et 
pET21C-clone 2 (1077 pb) . Une reactivite a ete observee 
sur un temoin neuro log ique et il est inter essant de noter 

10 que les ARN extraits a partir de ce serum, apres 1 ' etape 
de transcriptase inverse, sont aussi amplifies par PCR 
dans la region pol. Ceci suggere que des personnes n'ayant 
pas declare une SEP peuvent egalement heberger et exprimer 
ce virus. Par contre, un temoin (donneur CTS) apparemment 

15 sain, possede des anticorps anti-gag (clone 2, 1077 pb) . 
Ce qui est compatible avec un immunite acquise contre 
MSRV-1 en dehors d'une maladie autoimmune associee 
declaree . 

20 EXEMPLE 7 : OBTENTION D 1 UN CLONE LB13 CONTENANT EN 3 1 

UNE PARTI E HOMOLOGUE AU CLONE 2 CORRESPONDANT AU GENE GAG 
ET EN 5' UNE PART IE HOMOLOGUE AU CLONE 5M6 CORRESPONDANT A 
LA REGION LTR U5 • 



25 Une RT-PCR (" reverse-transcriptase-polymerase 

chain reaction ") a ete effectuee a partir de 1 1 ARN total 

extrait de virions, provenant de surnageants de cellules 

lymphocytaires B des patients atteints de sclerose en 

plaques, concentres par ultracentrif ugations . La synthese 

30 de cDNA a ete realisee avec une amorce specif ique SEQ N° 

TM 

XXX et la transcriptase inverse " Expand RT " de 
BOEHRINGER MANNHEIM selon les conditions preconisees par 
la societe. 

Amorce utilisee pour la synthese du cDNA, identifiee par 
35 SEQ ID NO: 138: 

5 1 CTT GGA GGG TGC ATA ACC AGG GAA T 3 ' 
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Une amplification par PCR a ete realisee avec la 
Tag polymerase (Perkin Elmer, France) sous les conditions 
suivantes: 94°C 1 min, 55°C 1 min, 72°C 2 min pendant 35 
cycles et 72 °C pendant 7 min et avec un volume reactionnel 
5 final de 100 /xl. 

Amorces utilisees pour 1 1 amplif ication par PCR: 

- amorce 5', identifiee par SEQ ID NO: 139 
5 ' TGT CCG CTG TGC TCC TGA TC 3 1 

- amorce 3', identifiee par SEQ ID NO: 138 
10 5 1 CTT GGA GGG TGC ATA ACC AGG GAA T 3 1 

Une deuxieme amplification par PCR dite " semi- 
nichee " a ete realisee avec une amorce 3 ■ situee a 
l'interieur de la region deja amplif iee. Cette deuxieme 
amplification a ete effectuee sous les memes contitions 
15 experimentales que celles utilisees lors de la premiere 
amplification, en utilisant 10 /xl du produit 
d 1 amplif ication issu de la premiere PCR. 

Amorces utilisees por 1 f amplif ication par PCR " semi- 
nichee " : 

20 - amorce 5', identifiee par SEQ ID NO: 139 
5 1 TGT CCG CTG TGC TCC TGA TC 3 1 

- amorce 3 1 , identifiee par SEQ ID NO: 140 
5 ' CTA TGT CCT TTT GGA CTG TTT GGG T 3 1 

Les amorces SEQ ID NO: 138 et SEQ ID NO: 14 0 sont 
25 specif iques de la region gag, clone 2 position 
nucleotidique n° 373-397 et n° 433-456. Les amorces 
utilisees dans la region 5 f ont ete definies sur des 
sequences des clones obtenus lors d'essais prealables. 

Un produit d 1 amplif ication de 764 pb a ete obtenu 
30 et clone de la fagon suivante: 

L'ADN amplif ie a ete insere dans un plasmide a 
l»aide du kit TA Cloning™. Les 2 /xl de solution d'ADN ont 
ete melanges avec 5 fsl d'eau distillee sterile, 1 ^1 d'un 
tampon de ligation 10 fois concentre "10X LIGATION 
35 BUFFER", 2 ^1 de "pCR™ VECTOR 11 (25 ng/ml) et 1 /xl de "T4 
DNA LIGASE" . Ce melange a ete incube une nuit a 14 °C. Les 
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etapes suivantes ont ete realisees conformement au 
instructions du kit TA Cloning® (Invitrogen) . Le melange a 
ete etale apres transformation de la ligation dans des 
bacteries E . coli INVaF 1 . A la fin de la procedure, les 
5 colonies blanches de bacteries recombinantes ont ete 
repiquees pour etre cultivees et permettre 1* extraction 
des plasmides incorpores selon la procedure dite de 
"minipreparation d • ADN" (17). La preparation de plasmide 
de chaque colonie recombinante a ete coupee par 1 1 enzyme 

10 de restriction Eco RI et analysee sur gel d 1 agarose. Les 
plasmides possedant un insert detecte sous lumiere UV 
apres marquage du gel au bromure d'ethidium, ont ete 
selectionnes pour le sequengage de 1 ' insert, apres 
hybridation avec une amorce complementaire du promoteur T7 

15 present sur le plasmide de clonage du TA cloning kit®. La 

reaction prealable au sequengage a ensuite ete effectuee 

selon la methode preconisee pour 1 1 utilisation du kit de 

TM 

sequengage "PRISM Ready Reaction Amplitaq® FS , 

TM 

DyeDeoxy Terminator" (Applied Biosystems, ref. 402119) 
20 et le sequengage automatique a ete realise sur les 

appareils 373 A et 377 Applied Biosystems, selon les 

instructions du fabricant. 

Le clone LB13 obtenu contient une region N- 

terminale de gene gag MSRV-1 homologue au clone 2 et un 
25 LTR correspondant a une partie de la region U5 . Entre la 

region U5 et gag un site de fixation pour les ARN de 

transfert, le PBS " primer binding site " a ete identifie. 

La sequence nucleotidique du fragment de 764 pb 

TM 

du clone LB13 dans le plasmide "pCR vector" est 
30 representee dans 1 ' identif icateur SEQ ID NO: 141. 

Le site de fixation pour les ARN de transfert, 
presentant une sequence du type PBS tryptophane, a ete 
identifie en position nucleotidique n°342-359 du clone 
LB13* 

35 Comme ce meme PBS a ete retrouve dans les copies 

endogenes homologues a MSRV1, la famille endogene ainsi 
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definie est appelee dorenavant HERV W, selon la 
nomenclature proposee pour les families de retrovirus 
endogenes (W=Tryptophane) . 

Une ORF courte d 1 environ 65 acides amines a ete 
5 retrouvee dans la region U5 du LTR 5' du clone LB13. 

Sequence de l'ORF : 
PMASNRAITLTAWSKIPFLGIRETKNPRSENTRLATMLEAAHHHFGSSPPLSWELWEQ 

GPQVTIW . 

10 La sequence nucleotidique correspondante debutant 

par un codon ATG est susceptible d'etre exprimee dans un 
ADN sous genomique a partir d'un LTR proviral (U3RU5) • 

Un autre clone, denomme LA15 a ete obtenu sur 
15 1 • ARN total extrait de virions concentres par 
ultracentrifugation a partir d'un surnageant de culture de 
synoviocytes provenant d'un patient atteint de 
polyarthrite rhumatoide. La strategie d ' amplification et 
clonage du clone LA15 est exactement la meme qui a ete 
20 utilisee pour le clone LB13 . 

La sequence nucleotidique du clone LA15 qui est 
representee dans 1 ■ identif icateur SEQ ID NO: 142, est tres 
similaire au clone LB13. Ceci suggere que le retrovirus 
MSVR-1 detecte dans la sclerose en plaque presente des 
25 sequences similaires a celles rencontrees dans la 
polyarthrite rhumatoide . 

EXEMPLE 8 : RECONSTRUCTION D 'UNE REGION RU5-GAG A PARTIR 
DES CLONES LB15, LB13 , CL2 ET CL17 

30 

Les clones CL2 et LB13 ont deja ete deer its dans 
les exemples precedents, Le clone LB15 a ete obtenu en 
utilisant la sequence R du LTR du clone cl6 pour definir 
une amorce en 5 1 et les amorces anti-sens utilisees sont 
3 5 les memes que pour le clone LB13 . Le clone CL17 a ete 
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obtenu par nested RT-PCR en utilisant les amorces 
suivantes : 

5 1 -TCATGCAACTGCACTCTTCTGGTCCG-3 ' ( sens) 
5 5 1 -TCTTGCACT AACCTCCACTGTCCGTTGG- 3 1 (anti-sens) 

5 1 -ATCCCCCAGTAACAATTTGGTGACCACG-3 • ( sens ) 

5 1 -TCGGGTCTAAGAGGGTACTTCCTTTGGTAGG-3 1 ( anti-sens ) 

10 Le clone LB15 a ete obtenu a partir de virions 

obtenus par culture de cellules de SEP. Le clone LB17 a 
ete obtenu a partir de culture de plasma de patient SEP. 

Ces clones chevauchants ont permis de reconstruire 
une sequence RU5-gag avec une ORF potentielle dans le gene 

15 gag, telles que presentees a la figure 14. 

EXEMPLE 9; OBTENTION D 1 UN CLONE 87-2 3 

La region correspondant a 1 ' integrase a ete 
20 amplifiee et clonee a partir de plasma de SEP en utilisant 
une semi-nested RT PCR avec les amorces suivantes situees 
dans les regions pol et env de MSRV1. 

Dans la region pol : 
25 5 1 -TTACGCAGGTCTCAGGGATGAGCTT-3 » (sens-PCR primaire) 
5 1 -CGGCAGTAGCAGTCTTAGTATCTGAAGCAGTTA-3 ' ( sens-PCR 
secondaire) 

Dans la region env, 
30 5 1 — GGTACGGAGGGTTTCATGTAGTTTTGAG-3 1 (anti-sens PCR primaire 
et seconda ire ) 

Le clone amplifie comporte 774 pb dans la region 
pol/RT, toute la region integrase (1197 pb) et le debut de 
3 5 la region env (480 pb) . La sequence nucleotidique 
correspondant a la region integrase et la traduction en 
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acides amines de l'ORF potentiel sont presentes a la 
figure 15. 

EXEMPLE 10 : CONFIRMATION DE LA PRESENCE D 1 ARN CONTENANT 
5 DES SEQUENCES ENV APPARENTEES A ERV9 DANS LES PARTICULES 
RETROVI RALES ASSOCIEES AU GENOME MSRV1 : 



Des sequences apparentees a ERV9 ont ete trouvees 
en proportion minoritaire dans les preparations du virion 

10 provenant de SEP par rapport aux sequences MSRV1. 
L 1 existence de phenomenes de co-encapsidation de sequences 
endogenes phy logeniquement proches dans des particules 
retrovirales produites par une souche replicative a ete 
decrite. De maniere surprenante une region d'ARN 

15 comprenant une ORF commen^ant dans la partie 3 1 d 1 env et 
se continuant potentiellement dans le LTR3 1 a ete 
retrouvee dans differents echantillons de SEP. Afin de 
preciser 1' existence d'une ORF des essais de 
transcription-traduction ont ete realises et ont permis de 

20 montrer la realite d'une ORF env contenant toute la partie 
transmembranaire (TM) et se terminant au debut du LTR 
putatif. Cependant une trame additionnelle (ORFX) fait 
suite et se poursuit dans le LTR 3 1 . Les deux produits 
d 1 expression ont ete visualises et leurs ORFs respectives 

25 ont ete sous donees. La figure 16 represente les 
sequences nucleotidique et peptidique du clone B13 deja 
decrit en precisant les ORFs dans la region env tronquee 
et dans le LTR putatif. La presence de tels ARN peut etre 
a l'origine de recombinaisons avec la souche replicative 

30 et par consequent generer des souches de pathogenecite 
modif iee . 
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REVENDI CATIONS 

1. Materiel nucleique, a 1 1 etat isole ou purifie, 
comprenant une sequence nucleotidique choisie dans le 

5 groupe qui consiste en (i) les sequences SEQ ID NO: 112, 
SEQ ID NO: 114, SEQ ID NO: 117, SEQ ID NO: 120, 

SEQ ID NO: 124, SEQ ID NO: 130, SEQ ID NO: 141 et 

SEQ ID NO: 142 ; (ii) les sequences complementaires des 
sequences (i) ; et (iii) les sequences equivalentes aux 
10 sequences (i) ou (ii), en particulier les sequences 
presentant pour toute suite de 100 monomeres contigus, au 
moins 50 %, et pref erentiellement au moins 70 % 
d'homologie avec respectivement les sequences (i) ou (ii). 

2. Materiel nucleique, a 1 1 etat isole ou purifie, 
15 codant pour un polypeptide presentant, pour toute suite 

contigue d 1 au moins 3 0 acides amineees, au moins 50 %, et 
de preference au moins 70 % d'homologie, avec une sequence 
peptidique choisie dans le groupe qui consiste en 
SEQ ID NO: 113, SEQ ID N°115, SEQ ID NO: 118, 

20 SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

3. Materiel nucleique retroviral, dont le gene pol 
comprend une sequence nucleotidique identique ou 
equivalente a une sequence choisie dans le groupe qui 
consiste en SEQ ID NO: 112, SEQ ID NO: 124 et leurs 

25 sequences complementaires. 

4. Materiel nucleique retroviral, dont 1 1 extremite 
5 1 du gene pol commence au nucleotide 1419 de 
SEQ ID NO: 130. 

5. Materiel nucleique retroviral, dont le gene pol 
30 code pour un polypeptide presentant, pour toute suite 

contigue d'au moins 30 acides amineees, au moins 50 %, et 
de preference au moins 7 0 % d'homologie, avec la sequence 
peptidique SEQ ID NO: 113. 

6. Materiel nucleique retroviral, dont 1 1 extremite 
35 3* du gene gag finit au nucleotide 1418 de SEQ ID NO: 130. 
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7. Materiel nucleique retroviral, dont le gene env 
comprend une sequence nucleotidique identique ou 
equivalente a une sequence choisie dans le groupe qui 
consiste en SEQ ID NO: 117, et ses sequences 

5 complement a ires . 

8. Materiel nucleique retroviral, dont le gene env 
comprend une sequence nucleotidique qui commence au 
nucleotide 1 de SEQ ID NO: 117 et finit au nucleotide au 
nucleotide 233 de SEQ ID NO: 114. 

10 9. Materiel nucleique retroviral, dont le gene env 

code pour un polypeptide presentant, pour toute suite 
contigue d 1 au moins 30 acides amineees, au moins 50 %, et 
de preference au moins 70 % d'homologie, avec la sequence 
SEQ ID NO: °118 . 

15 10. Materiel nucleique retroviral dont la region 

U3R du LTR 3 ' comprend une sequence nucleotidique qui se 
termine au nucleotide 617 de SEQ ID NO: 114. 

11. Materiel nucleique retroviral dont la region 
RU5 du LTR 5 1 comprend une sequence nucleotidique qui 

20 commence au nucleotide 755 de SEQ ID NO: 120 et finit au 
nucleotide 337 de SEQ ID NO: 141 ou SEQ ID NO: 142. 

12. Materiel nucleique retroviral comprenant une 
sequence qui commence au nucleotide 755 de SEQ ID NO: 120 
et qui se termine au nucleotide 617 de SEQ ID NO: 114. 

25 13. Materiel nucleique retroviral selon l'une 

quelconque des revendications precedentes, caracterise en 
ce qu'il est associe a au moins une maladie auto-immune 
telle que la sclerose en plaques ou la polyarthrite 
rhumatoide . 

3 0 14. Fragment nucleotidique comprenant une sequence 

nucleotidique choisie dans le groupe qui consiste en (i) 
les sequences SEQ ID NO: 112, SEQ ID NO: 114, 

SEQ ID NO: 117, SEQ ID NO: 120, SEQ ID NO: 124, 

SEQ ID NO: 130, SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii) 

35 les sequences complementaires des sequences (i) ; et (iii) 
les sequences equivalentes aux sequences (i) ou (ii) , en 
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particulier les sequences presentant pour toute suite de 
100 monomeres contigus, au moins 50 %, et 
preferentiellement au moins 70 % d'homologie avec 
respectivement les sequences (i) ou (ii). 
5 15, Fragment nucleotidique selon la revendication 

14, consistant en une sequence nucleotidique choisie dans 
le groupe qui consiste en (i) les sequences 
SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117, 

SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 130, 

10 SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii) les sequences 
complementaires des sequences (i) ; et (iii) les sequences 
equivalentes aux sequences (i) ou (ii), en particulier les 
sequences presentant pour toute suite de 100 monomeres 
contigus, au moins 50 %, et preferentiellement au moins 

15 70 % d'homologie avec respectivement les sequences (i) ou 
(ii) . 

16. Fragment nucleotidique comprenant une sequence 
nucleotidique codant pour un polypeptide presentant, pour 
toute suite contigue d'au moins 3 0 acides amineees, au 

20 moins 50 %, et de preference au moins 70 % d'homologie, 
avec une sequence peptidique choisie dans le groupe qui 
consiste en SEQ ID NO: 113, SEQ ID N°115, SEQ ID NO: 118, 
SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

17. Fragment nucleotidique selon la revendication 
25 16, consistant en une sequence nucleotidique codant pour 

un polypeptide presentant, pour toute suite contigue d'au 
moins 3 0 acides amineees, au moins 50 %, et de preference 
au moins 70 % d'homologie, avec une sequence peptidique 
choisie dans le groupe qui consiste en SEQ ID NO: 113, 
30 SEQ ID N°115, SEQ ID NO: 118, SEQ ID NO: 121, 

SEQ ID NO: 135 et SEQ ID NO: 137. 

18. Sonde nucleique pour la detection d'un 
retrovirus associe a la sclerose en plaques et/ou la 
polyarthrite rhumatoide, caracterisee en ce qu'elle est 

35 susceptible de s'hybrider specif iquement sur tout fragment 
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selon l'une quelconque des revendications 14 a 17, 
appartenant au genome dudit retrovirus. 

19. Sonde selon la revendication 18, caracterisee 
en ce qu'elle possede de 10 a 100 nucleotides, de 

5 preference de 10 a 30 nucleotides. 

20. Amorce pour 1 ' amplification par polymerisation 
d'un ARN ou d'un ADN d 1 un retrovirus associe a la sclerose 
en plaques et/ou la polyarthrite rhumatoide, caracterisee 
en ce qu'elle comprend une sequence nucleotidique 

10 identique ou equivalente a au moins une partie de la 
sequence nucleotidique d'un fragment selon l'une 
quelconque des revendications 8 a 11, notamment une 
sequence nucleotidique presentant pour toute suite de 10 
monomeres contigus, au moins 50 %, de preference au moins 

15 70 % d'homologie avec au moins ladite partie dudit 
fragment. 

21. Amorce selon la revendication 20, caracterisee 
en ce que sa sequence nucleotidique est choisie parmi 
SEQ ID NO: 116, SEQ ID NO: 119, SEQ ID NO: 122, 

20 SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, 

SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 132, et 

SEQ ID NO: 133. 

22. ARN ou ADN, et notamment vecteur de 
replication et/ou d 1 expression , comprenant un fragment 

25 genomique du materiel nucleique selon l'une quelconque des 
revendications 1 a 7 ou un fragment selon l'une quelconque 
des revendications 14 a 17. 

23. Peptide code par tout cadre de lecture ouvert 
appartenant a un fragment nucleotidique selon l'une 

30 quelconque des revendications 14 a 17, notamment 
polypeptide, par exemple oligopeptide formant ou 
comprenant un determinant antigenique reconnu par des sera 
de patients infectes par le virus MSRV-1, et/ou chez 
lesquels le virus MSRV-1 a ete reactive. 

35 24. Peptide selon la revendication 23 comprenant 

une sequence identique, partiellement ou totalement, ou 
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equivalente a une sequence choisie parmi SEQ ID NO: 113, 
SEQ ID N°115 / SEQ ID NO: 118, SEQ ID NO: 121, 

SEQ ID NO: 135 et SEQ ID NO: 137. 

25. Composition diagnost ique , prophylactique , ou 
5 therapeutique, notamment pour inhiber l 1 expression d'au 
moins un retrovirus associe a la sclerose en plaques et/ou 
a la polyarthrite rhumatoide, comprenant un fragment 
nucleotidique selon 1 1 une quelconque des revendicat ions 14 
a 17. 

10 26. Precede pour detecter un retrovirus associe a 

la sclerose en plaques et/ou a la polyarthrite rhumatoide, 
dans un echantillon biologique, caracterise en ce que 1 1 on 
met en contact un ARN et/ou un ADN presume appartenir ou 
provenant dudit retrovirus, ou leur ARN et/ou ADN 

15 complementaire, avec une composition comprenant un 
fragment nucleotidique selon 1 1 une quelconque des 
revendications 14 a 17 . 
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FIG 2 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

GZTTATAGAA GGAOQQCTAG TATGGGGTAA TCCXXTCIQG GAAAGCAAQC 50 
AYRR TPS M G SP LG NQA 

LIE GPLV WGN PLW ETKP 
L.K DP. YGVI PSG KPS 

OCX^GTACTC AGCAQGAAAA ATAGAATAGG AAAGCICACA AGGACATACT 100 
PVL SRKN RIG NLT RTYF 
QYS AGK IE.E TSQ GHT 
PSTQ QEK N R KPHK DIL 

TTQCTOCCCT CCAGATGGCT AGGCACIGAG GAAGGAAAAA TACITICACC 150 

PPL QMA SH.G RKN TFT 
FLPS RWL ATE EGKI LSP 
SSP PDG. PLR KEK YFHL 

TGCAGCTAAC CAACAGAAAT TACTTAAAAC QCTTCAGCAA AOCTIOCACT 200 
CS.P TEI T,N PSPN LPL 
A A N QQKL LKT LHQ TFHL 
QLT NRN YLKP FTK PST 

TAG3CATTGA TAGGAGGCAT CAGATG30CA AATTATTATT TACTGGAQCA 250 
RH. HPS DGQ III YWTR 

GID STH QMAK LLF TGP 
A L I API R WP NYYL LDQ 

QGGCITTTCA AAACTATCAA GAAGATAGTC AGGQGCTGTG AAGTGTGCCA 300 

PFQ NYQ EDSQ GL. SVP 
GLFK TIK KIV RGCE VCQ 
AFS KLSR R.S GAV KCAK 

AAGAAATAAT 310 
K K . 
R N N 
E I 
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FIG 2 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

ccctgeatct teaacctoct tgttaagttt GTCTCTTOCA GAATCAAAAC 50 

PCIF N L L VKF VSSR IKT 
PVS LTSL L S L SLP E SKL 
LYL . P P C.VC L F Q NQN 

TGTAAAACTA CAAAl'lUl'lC TTCAAATGGA GCACCAGATG GAGTCCATGA 100 
VKL QIVL QME HQ.M ESMT 
. NY KLF FKWS TRW SP. 
CKTT NCS SNG APDG VHD 

CTAAGATOCA COGIGGAOQC CIGGACXD3GC CTGCEAGQOC ATCCTOOGAT 150 

KIH RGP LDRP ASP CSD 
LRST VDP WTG LLAH APM 
. DP PWTP GPA C.P MLRC 

GTTAATGACA TTGAAGGGAC OQCTCOCX3AG GAAATCICAA CIGC^CAADC 200 
VNDI EGT PPE EIST AQP 
LMT LKAP LPR KSQ LHNP 
. . H . R H PSRG NLN CTT 

CCEACEATOC ODCAATTCAG GGGGAAQCAG TTAGAQCQGT CATCAGOGAA 250 
LLC PNSA GSS . S G HQPT 
YYA PIQ REAV RAV I S Q 
PTMP QFS GKQ LERS SAN 

CCTCCCCAAC AGCACTTGGG TTITCCTGTT GAGAGGGGGG ACTGAGAGAC 300 

SPT ALG FSC. EGG LRD 
PPQQ HLG FPV ERGD . E T 
LPN STWV FLL RGG TERQ 

AGGACTAQCT GGATTTCCTA GGGCAACGAA GAATCCCTAA GCCTAGCTGG 350 
RTSW IS. ANE ESLS LAG 
GLA GFPR PTK NP. A.LG 
D.L DFL GQRR IPK PSW 
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FIG 3 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

GAAQGTGACT GCATOCAGCT CTAAACATGG GGCITGCAAC TTAGCTCACA 400 
KVT A S' T S KHG A C N L A H T 
R . L HPP LNMG LAT . L T 
EGDC IHL . T W GL QL SSH 

0003AGCAAT CAGAGAGCIC ACTAAAATGC TAATTAGGCA AAAATAGGAG 450 

RPI REL TKML IRQ K.E 
PDQS ESS LKC L G K NRR 

PTN QRAH . N A N.A KIGG 

GTAAAGAAAT AQQCAATCAT CIATIGaCIG AGAGCACAGC GGGAGGGACA 500 
VKK. PII YCL RAQR EGQ 
. RN SQSS IA. EHS GRDK 
KEI ANH LLPE STA GGT 

AGGATO33GA TATAAACGCA GQCATIOGAG C033GAAOGG CAAGCOOCTT 550 
GSG Y KPR HSS RQR QPP L 
DRD INP GIRA GNG NPL 
RIGI .TQ AFE PATA TPF 

IGGGIDCXXT OGCTITGIAT G0GO3CICIG TITICACIUT ATITCACTCT 600 

GPL PLY GRSV FTL FHS 
WVPS LCM GAL FSLY FTL 
GSP PFVW ALC FHS ISLY 

ATIAAATCTT GCAACIGAAA AAAAAAAAAA AAAAA 635 
IKSC N.K KKK K 
LNL ATEK KKK K 
• IL QLK KKKK K 
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FIG 4 
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ATGQCCCICC CTEA.TCATAC TTTIUICTTT ACIGTTCTCT TAQXXXTTT 50 
MALP YHT FLF T V L L PPF 
WPS LIIL FSL LFS YPLS 
GPP LSY FSLY C S L TPF 

CQCICICACT QCACCCOCTC CATGCIOCTG TACAACCAGT AGCICOGCTT 100 
ALT APPP CCC TTS SSPY 
LSL HPL H A A V QPV APL 
RSHC TPS MLL YNQ. LPL 

AQCAAGAGTT TCTATGAAGA A0G03QCTTC CIQGAAATAT TGATGQCXXA 150 

QEF L.R TRLP GNI DAP 
TKSF YEE RGF LEIL MPH 
PRV SMKN A A S WKY .CPI 

TCAimAQGA GTTTATCIAA GGGAAACTGC AGCTICACIG CXXACACXXA 200 
SYRS LSK GNS TFTA HTH 
HIG VYLR ETP PSL PTPI 
I.E FI. GKLH L H C PHP 

TATGOOOOGC AACTGCTATA ACICTOCCAC TCTTTGCATG CATGCAAATA 250 
MPR NCYN SA T LCM HANT 
CPA T A I TLPL FAC MQI 
YAPQ L L LCH SLHA CKY 

CTCATTATTG GACAQGGAAA ATGATTAATC CTAGTTGTCC TGGAGGACTT 300 

HYW TGK M I N P SCP GGL 
LIIG QGK .LI LVVL EDL 
SLL DREN D.S . LS WRTW 

GGAGCCAGTG TCTGTTGGAC TTACTTCACC CATACCAGTA TGTCTGATGG 350 
GATV CWT YFT HTSM SDG 
EPL SVGL TSP IPV CLMG 
SHC LLD LLHP YQY V.W 
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FIG 4 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

AOCTCACCIG IGTAAAATTT AGCAATACTA TAGACACAAC CAGCTCXDCAA 750 

LTC VKF SNTI DTT SSQ 
TSPV N L AIL . T Q P APN 

PHL CKI. QYY RHN QLPM 

TGCATCAGGT OGGfEAACAOC TOCOOV3GA ATAGTCIGCC TACCCTCAGG 800 
CIRW VTP PTR IVCL PSG 
ASG G.HL PHE . S A YPQE 
HQV GNT SHTN SLP TLR 

AATALL'l'i'lTl' GTCTGTGGTA CCTCAQCCTA TCATIGTTIG AATGGCTCTT 850 
IFF VCGT SAY HCL NGSS 
YFL SVV PQPI IV. MAL 
NIFC LWY LSL SLFE WLF 

CAGAATCEAT GIGCTIXXTC TCATICTEAG TGQGGQCTAT GACGATCEAC 900 

ESM CFL SFLV PPM TIY 
QNLC A SS HS. CPL. PST 
RIY VLPL ILS APY DHLH 

ACTCAACAAG ATITATACAA TCATCICGTA CCTAAGGCCC ACAACAAAAG 950 
TEQD LYN HVV PKPH NKR 
LNK IYTI MSY LSP TTKE 
.TR FIQ SCRT .AP QQK 

AGTAOCXZATT CTICL'l'i'l'lG TEATCAGAGC AGGAGIGCTA GGCAGACTAG 1000 
VPI LPFV IRA GVL GRLG 
YPF FLL LSEQ EC. A D. 
STHS SFC YQS RSAR QTR 

GTACIGGGAT TO3CAGTATC ACAACCTCTA CTCAGTIUEA CTACAAACTA 1050 

TGI GSI TTST QFY YKL 
VLAL AVS QPL LSST TNY 
YWH WQYH NLY SVL LQTI 
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TCICAAGAAA TAAATOGIGA CATOGAACAG GTCACTGACT COTIGGTCAC 1100 
SQEI NGD MEQ VTDS LVT 
LKK M V T WNR S L T PWSP 

SRN K W . HGTG H.L PGH 

CTIGCAAGAT CAACTTAACT CQCTCAGCAGC AGIAGTOCTT CAAAATCGAA 1150 
LQD QLNS L A A V V L QNRR 
CKI N Li T P.QQ . S F KIE 
LARS T.L PSS SSPS KSK 

GAQCTTTAGA IT I OJIA ACC GQCAAAAGAG GQQGAADCTC TTTATTTTEA. 1200 

A Li D LLT AKRG GTC L F L 
EL.T C.P PKE GEPV Y F . 
SFR LANR QKR GNL FIFR 

GGAGAAGAAC QCTGTEATm TGITAATCAA TCCAGAATIG TCACIGAGAA 1250 
GEER CYY VNQ SRIV TEK 
EKN AVIM LIN PEL SLRK 
RRT LLL C.SI QNC H.E 

AGTEAAAGAA ATTOGAGATC GAATACAATC TAGAGCAGAG GAGCTTCAAA 1300 
VKE IRDR IQC RAE ELQN 
LKK FEI EYNV EQR SFK 
S.RN SRS NTM S R G ASK 

ACAOGGAACG CIGGGGCCTC CTCAGQCAAT GGATOOCCTG GGTTCTCCCC 1350 

TER WGL L S Q W MPW VLP 
TPNA GAS SAN GCPG FSP 
HRT LGPP QPM DAL GSPL 

T1LT1AGGAC CTCTAGCAGC TCHAATATIG TIACTGCIUT TIGGAGGCIG 1400 
FLGP LAA LIL LLLF GPC 
S.D L.QL . Y C YSS LDPV 
LRT SSS SNIV TPL WTL 



BNSDOClD:<WO 9902666A2> 



WO 99/02666 



PCT/FR98/01460 



8 / 32 
FIG 4 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

TATCITTAAC CICLT1U1TA. AGTTIUICIC TTOCAGAATT GAAQCIUEAA 1450 
IFN LLVK FVS S R ' I EAVK 
SLT SLL SLSL PEL KL. 
YL.P PC. VCL FQN. SCK 

AGCTACAGAT G3ICTEACAA ATQ3AACCCC A 1481 

LQM VLQ MEP 
SYRW SYK WNP 
ATD GLTN GTP 
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TCAAAATOGA AGAQCITEAG ACTIGCTAAC GGQCAAAAGA Q333GAACCT 50 
SKSK SF R LAN RQKR GNL 
QNR RALD LLT AKR GGTC 
KIE EL. TC.P PKE GEP 

GI'l'im'l'ITl' AGGQGAAGAA T3CIGTEAGT A3XJTEAATCA ATCIGGAATC 100 
FIF RGRM LLV C.S IWNH 
LFL GEE CC.Y VNQ SGI 
VYF. GKN AVS MLIN LES 

ATIACIGAGA AAGTEAAAGA AA.TTTGAGAT GGAATATAAT GTAGAGCAGA 150 

Y . E S.R NLRS NIM .SR 
ITER V KE I . D RI.C RAE 
LLR KLKK FEI EYN VEQR 

GGAGCTICAA AACACIGCAC GCTQQGGQCT CCTTAGCCAA T3GATGCXXT 200 
GPSK HCT LGP PQPM DAL 
DLQ NTAP WGL LSQ WMPW 
TFK TLH PGAS SAN GCP 

GGACICICXX CITCTTAGGA CCTCTAGGAG CIATAATATT TITACIGCTC 250 
DSP LLRT SSS YNI FTPL 
TLP FLG P L A A I I F LLL 
GLSP S.D L.Q L.YF YSS 

TTIGGAGQCT GTATCTICAA CTTDLTIUi'l' AAGTTIGTCT CTIOCAGAAT 300 

WTL YLQ LPC. VCL FQN 
FGPC IFN FLV KFVS SRI 
LDP VSST SLL SLS LPEL 

TCAAGCIGTA AAGCTACAAA TAGl'lUl'lCA AATGGAAGGC CAGATGCAGT 350 
. SCK ATN SSS NGTP D A V 
EAV KLQI VLQ MEP QMQS 
KL. SYK F F K WNP RCS 
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COtfGACTAA AATUIACCGT GGAGGGCTGG AQCO30CTGC TAGACTATOC 
HD. NLPW TPG PAC T M L 

MT K IYR GPLD RPA RLC 
P.LK STV DPW TGLL DYA 

TUIGATGTEA ATGACATTGA AGTCAGCGCT (XOGAQGAAA TCICAACTGC 450 

. C . . H . SHPSRGNLNC 
S D V N DIE VTP PEEI STA 
LML MTLK SPL PRK SQLH 

ACAAQCCCIA CTACACTGCA ATICAGTAGG AAGCAGTEAG AGCAGTIGTC 500 
TTPT TLQ FSR K Q L E QLS 
QPL L HSN SVG SS. SSCQ 
NPY YTP I Q . E A V R AVV 

AGOCAAGCTC CCCAACAGTA CTIGGGTITr CCIGTTGAGA GGGIGGACIG 550 
ANL PNST WVF LLR GWTE 
PTS PTV LGFS C.E GGL 
S Q P P Q Q Y LGF PVER VD. 

AGAGACAGGA CEAGCIGGAT TIDCEAGGCT GACTAAGAAT OOCNAAGGCT 600 

RQD L D FLG. LRI PKP 

RDRT S W I S.A D.ES XSL 
ETG LAGF PRL TKN PXAX 

ANCIGGGAAG GIGACGGCAT CCATCITIAA ACATOQQGCT 1GCAACTEAG 650 
XWEG DRI HL. TWGL QLS 
XGK V TAS IFK HGA CNLA 
LGR . P H PSLN MGL AT. 

CICACACOOG ACCAATCAGA GAGCTCACTA AAATGCTAAT CAQGCAAAAA 700 
S HP TNQR AH. NAN QAKT 
HTR PIR ELTK MLI RQK 
LTPD QSE SSL KC.S GKN 
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CAGGAGGTAA AQCAATAGOC AATCATCTAT TGOCTGAGAG CACAGGGGGA 750 

GGK A I A NHLL PES TAG 
QEVK Q.P I I Y CLRA QRE 
R R . SNSQ SSI A . E HSGK 

AGGACAAQGA TIGQGATATA AACICAG3CA TTCAAGQCAG CAACAGCAAC 800 
RTRI G I . TQA FKPA TAT 
GQG LGYK LRH SSQ QQQP 
DKD WDI NSGI Q A S NSN 

OCQCTITG3G TCCCCTCCCA TIGTATG9GA GCICIUITIT CACTCEATTT 850 
PFG SPPI VWE LCF HSIS 
P L G PLP LYGS SVF TLF 
PLWV PSH CMG ALFS LYF 

GACTCTATEA. AATCATGCAA CTGCACICTT CT3GTOOGTG TITITTATGG 900 

L Y . IMQ LHSS GPC F L W 
HSIK SCN CTL LVRV FYG 
TLL N H A T ALF WSV FFMA 

CTCAAQCIGA QLTiTlUl'lC GOCATOCAQC ACTGCIGTTT GOCAC303TCA 950 
LKLS FCS PST TAVC HRH 
SS. AFVR HPP LLF ATVT 
QAE LLF AIHH CCL PPS 

CAGAQ0Q3CT GCTGACTTCC ATOCL'ITIUG ATCCAGCAGA GT3TOCACTG 1000 
RPA ADFH PFG SSR VSTV 
DPL LTS IPLD PAE CPL 
QTRC .LP SLW IQQS VHC 

TGCIOCIGAT GCAGOGAGGT ACXXATIGOC: ACTOOOGATC AGQCTAAAGG 1050 

LLI QRG THCH SRS G.R 
CS.S SEV PI A TPDQ AKG 
APD PARY PLP LPI RLKA 
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CTTQOCATTG TIOCIQCA3G GCTAAGTGQC T03GITIGIC CTAATAGAAC 1100 
LAIV PAW LSA WVCP NRT 
LPL FLHG .VP GFV LIEL 
CHC SCM AKCL GLS . N 

TGAACACTGG TCACTGQGTT (XAT3GTTCT CTTGCATGAC OCA03GCTTC 1150 
EHW SLGS MVL FHD PRLL 

NTG HWV PWFS SMT HGF 
. TLV TGF HGS LP.P TAS 

TAATAGAGCT ATAACACTCA CGGCATOQOC CAAGATTOCA TIDCTIGGTA 1200 

IEL . H S PHGP RFH SLV 
. . SY NTH RMA QDSI PWY 
NRA ITLT AWP KIP FLGI 

TCTGTGAGGC CAAGAAGGCC AGGICAGAGA ANGIGAGGCT TO0GAOCATT 1250 
SVRP RTP GQR X.GL PPF 
L.G QEPQ VRE X E A CHHL 
CEA KNP RSEX VRL ATI 

TGQGAAGTG3 QGCACTGGCA TTTTGGTAGC GGGGCAGCAC CATCTTGGGA 1300 
GKW PTAI LVA AHH HLGS 
GSG PLP FW.R PTT ILG 
WEVA HCH FGS GPPP SWE 



QCIGTGQGAG CAAGGATGOC GCAGTAACA 

CGS KDP PVT 
A V G A RIP Q. 
LWE QGSP SN 



1329 
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CCTAGAAOGT ATICTOGSGA ATT33GAOCA ATGHTGACACT 50 
PRTY SGE LGP M . H S DAK 
L E R I L E N WDQ CDT Q T L R 
. N V F W R IGTN VTL RR. 

GAAAGAAACG ATTTATATIC TICIQCACTA (XZCCTGGCC ACAATATCCT 100 
KET I Y I L LQY RLA TISS 
KKR FIF FCST AWP QYP 
ERND LYS SAV PPGH NIL 

CTICAA3GGA GAGAAAOCTC GCTTCCTCAG GGAACTATAA ATTATAACAT 150 

SRE RNL AS.G KYK L.H 
LQGR ETW L P E GSIN YNI 
FKG EKPG FLR E V . I I T S 

CATCTTACA3 CTAGAQTICT TCTCTAGAAA GGAGQGCAAA T3G^GTCAA3 200 
HLTA RPL L.K GGQM E.S 
I L Q LDLF CRK EGK WSEV 
SYS . T S SVER RAN GVK 

TGCCATATCT GCAAACnTC TTTICATEAA G£GACAACIC ACAATTAICr 250 
AIC ANFL FIK RQL TIM. 
PYV QTF FSLR DNS QLC 
CHMC KLS F H . ETTH NYV 

AAAAAGIGIG GTITAIQDOC TACAGGAA3C CCVCPGPGTC CPCCTCCCTA 300 

KVW FMP YRKP SES TSL 
KKCG LCP TGS PQSP PPY 
KSV VYAL QEA L R V HLPT 

<XXX2£XX3IC aXTOOOCEA C IOLT1CCIC AACEAATAA3 GAOCXXXXOT 350 
PQRP LPD S F L N . G PPF 

PSV PSPT PSS TNK DPPL 
PAS PPR LLPQ LIR TPL 

TAAQOGAAAC GGIOCAAAfiG GAGAT&3ACA AAGG3G7IAAA CAATCAAOCA 400 
NPN GPKG DRQ RGK Q.TK 

TQT VQK EIDK GVN NEP 
. PKR SKR R.T KG.T MNQ 

AAGAGTOO^A ATAIICXXOG ATEATOOOOC CTOCAAGCAG TCAGAD3AGG 450 

ECQ YSP IMPP PSS ERR 
KSAN IPR LCP LQAV RGG 
RVP IFPD YAP SKQ .EEE 

AGAATTO3GC QCAGOCAGAG TOOCSGTEBOC Tl'l'I'iCICIC TCAGACTTAA 500 
RIRP SQS ACT FFSL RLK 
EFG PARV PVP FSL SDLK 
NSA QPE CLYL FLS QT. 
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£OCAAATTAA AATAGACCTA GCTAAATTTT CAGATAAOOC TCAOQQCTAT 550 
AN. NRPR . I L R . P R L Y 

Q I K IDL GKFS DNP DGY 
SKLK . T . V N S Q I T L T A I 

ATTGATGTTT TACAAGGCTT AQGACAATCC TTTCAIUIGA CATGGAGAGA 600 

. CF TRV RTIL . S D MER 
IDVL QGL G QS FDLT WRD 
LMF YKG. DNP LI. HGEI 

TATAATGTTA CTACTAAATC AGACACTAAC OOCAAAIGSG AGAAGTIGOCG 650 
YNVT TKS DTN PK.E KCR 
IML LLNQ TLT PNE RSAA 
. CY Y.I RH.P QMR EVP 

CICTAACTOC AGCC0GA3AG TITOQQGATC TTTGCTATCT CAOIO^OGOC 700 
CNC SPRV WRS LVS QSGQ 
VTA ARE FGDL WYL SQA 
L.LQ PES LAI FGIS.VRP 

AACAATAGGA TGACAACAGA GGAAASAACA POICCCPCPG 750 

Q.D DNR GKNN SHR PAG 
NNRM TTE ERT TPTG Q Q A 
TIG . Q Q R KEQ LPQ ASRQ 

PGTIQOCPOT GT&3AOCTC ATT33GACAC AGAATCAGAA CAJQGAGATT 800 
SSQC RPS LGH RIRT WRL 
VPS VDPH WDT ESE HGDW 
FPV T L IGTQ NQN M E I 

GGIGOCACAA ACATTIGCTA NJTTOOJTGC TAGAAQGACT CTGGAAAACT 850 
VPQ TFAN LRA RRT EEN. 
CHK HLL TCVL EGL RKT 
GATN IC. LAC . K D . GKL 

AGGAAGAAGC CTATCAATTA CTCAATCATC TOCACTATAA CACA03^AA 900 

EEA YEL LNDV HYN TG K 
RKKP MNY SMM STIT QGK 
GRS L.IT Q-C PL. HRER 

GGAAGAAAAT CTEACTOCIT TICIQGACAG ACTAAGQG2G GCATIGAGGA 950 
GRKS YCF SGQ TKGG IEE 
EEN LTAF LDR LRE ALRK 
KKI LLL FWTD .GR H.G 

AGCATAOCTC QCTGICAGCT GACICTATIG AAGQOCAACT AATCTEAAAG 1000 
AYL PVT. LY. RPT NLKG 
HTS LSP DSIE GQL ILK 
SIPP CHL TLL KAN. S.R 
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GATAAJirTA TCPfJTCPGTC AGCIGC£GAC ATTAGAAAAA PCTTCAPAPG 1050 

.VYHSVSCRH .KKLQK 
DKFI TQS AAD IRK N FKS 
ISL SLSQ LQT L E K TSKV 

TCTO0CTTA3 GCOOGGMCA GAACTTKWV AOCXTATTTA ACTIQG3CATC 1100 
SALG PEQ NLE TLFN LAS 
LP. ARSR T.K PYL TWHP 
CLR PGA ELRN PI. LGI 

CrCA GTl ' l ' lT TATAATAGA3 ATCAGGM3A GCAG3CGAAA GQQGACAAAC 1150 
SVF YNRD QEE QAK RDKR 
QFF IIE IRRS RRN GTN 
LSFL . . R SGG AGET GQT 

GGGATAAAAA AAAAA33QGG GGTTOCACTAC TITAGICA2G GCCCTCA3QC 1200 

DKKKRGGPLL .SWPSG 
GIKK KGG VHY FSHG PQA 
G.K KKGG STT LVM ALRQ 

AAGGAGACTT TOGAGGCICT GCAAA&3QGA AAAGCIQGGC AAATCAAAIG 1250 
KQTL EAL QKG KAGQ IKC 
SRL WRLC KRE KLG KSNA 
ADF GGS AKGK SWA NQM 

QCTAAEA33G CIGGCTIOCA GTGCX3GTCTA CAPOGACACT TEAAAAAAGA 1300 
LIG LASS AVY KDT LKKI 
. .G WLP VRST RTL .KR 
PNRA GFQ CGL QGHF KKD 

ttatccaajT agaaatamc axxmrriG Tcr^roaocx: te?o?icmg 1350 

IQV EIS RPLV HAP YVK 
LSK. K..A APL SMPL TSR 
YPS RNKP PPC PCP LRQG 

GGAATCACIG TOCXXE2G3G GMGA^MA CICTfflCTCA 1400 

GITG rpt apg dedt lsq 

ESL EGPL PQG MKI L.VR 
NHW KAH CPRG . R Y SES 

GAAGCCATTA AOCAGATCAT QZPGCP£3C?G GACIGAGGGT 0000333003 1450 
KPL TR.S SSR TEG ARGE 
SH. PDD PAAG LRV PGA 
EAIN QMI QQQ D.GC PGR 

POOOOCPCCC CATOOCATCA CCCTCACAGA G00033Q3EA TCTTITGAOCA 1500 

RQP MPS PSQS PGY V.P 
SASP CHH PHR APGM FDH 
A P A HAIT LTE PRV CLTI 
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ATQGQCAGCA GQ2AICATCA TCATCATCAC AGCAGQQ30C TGCTTCOTGCG 50 
MGSS HHH HHH SSGL VPR 

GQGCAGQCAT ATOGCTAGCA TCACTGGIGG A2AGCAAATC GGTCGGATOC 100 
GSH MASM TGG QQM GRIL 

TAGAACX7EAT TCTGGAGAAT TOGGAG2AAT GIGACACICA GACGCTAAGA 150 
ERI LEN WDQC DTQ TLR 

AAGAAAOGAT TTATATTUIT CIGCAGTAOC GOCTOGC3CAC AATATCCTCT 200 
KKRF IFF CST AW-PQ YPL 

TCAAGQGAGA GAAADCT3GC TIOTIGAGGG AAGEATAAAT TATA^CATCA 250 
QGR ETWL PEG SIN YNII 

ICITA2AGCT AGACCICTIC TCTAGAAAGG AGGGCAAATG GAGIGAAGIG 300 
L Q L D L F CRKE GKW SEV 

CCATATCTCC AAACTTIUIT TICATTAAGA GACAACICAC AATTATGTAA 350 
PYVQ TFF SLR DNSQ LCK 

AAAGTTGIGGT TIAIGCOCTA CAGGAAGCQC TCAGAGKXA CCICCX7EACC 400 
KCG LCPT GSP QSP PPYP 

CCAGCCTCJOC CTOQOOGACT CCTTU^ICAA CTAATAAGGA COOOOOTTTA 450 
SVP SPT PSST NKD PPL 

AOQCAAAOGG TOCAAAAGGA GAEAGACAAA GQGGEAAACA AIGAADCAAA 500 
TQTV QKE IDK GVNN EPK 

GAGIGOCAAT AITCQQOGAT TATOCXXDCT OCAAQCAGIG AGAGGAQGAG 550 
SAN IPRL CPL Q A V RGGE 

AATTXmDOC AGOGAGAGIG (X7IGEAGCIT TITCTCIUIC AGACTEAAAG 600 
FGP A R V PVPF SLS DLK 

CAAATEAAAA TAGAOCEAGG TAAA1TCICA GATAAOQCIG A3GGCEATAT 650 
QIKI DLG KFS DNPD GYI 

TGAlUrrriA CAAQQGTEAG GA2AATCCTT TCAIUIGACA TOGAGAGATA 700 
DVL QGLG QSF DLT WRDI 

TAATCTEACT ACTAAATCAG ACACEAAOQC CAAASGAGAG AAGIQQ03CT 750 
MLL LNQ TLTP NER SAA 

CTAACIOCAG OOOGAGAGT3T TCQCGATCIT TOGTCATCICA GTCAGQOCAA 800 
VTAA REF GDL WYLS QAN 
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CAATAQGATG ACAACAGAGG AAAGAACAAC TGCX^CAGQC CAQCAQGCAG 850 
NRM TTEE RTT PTG QQAV 

TTCXCAGIUT AGACCCICAT TOGGACACAG AATCAGAACA TGGAGATTOG 900 
PSV DPH WDTE SEH GDW 

TOCO^CAAAC ATITGCTAAC TTQQGIGCTA GAAQGACTGA GGAAAACTAG 950 
CHKH LLT CVL EGLR KTR 

GAAGAAGCCT ATGAATTACT CAATGATCTC GACTATAACA CAQGGAAAQG 1000 
KKP MNYS MMS TIT QGKE 

AAGAAAATCT TACIGCTTTT CTGGACAGAC TAAG3GAGGC ATIGAOGAAG 1050 
ENL TAP LDRL REA LRK 

CATACUICOC TCICACCIGA CTCTATIGAA GGCCAACTAA TCTIAAAGGA 1100 
HTSL SPD SIE GQLI LKD 

TAAGTITATC ACICAGTCAG CTGCAGACAT TAGAAAAAAC TTCAAAAGTC 1150 
KFI TQSA ADI RKN FKSL 

T30CTAAGCT TGQGGCOGCA CTCGAGCAOC AQ2ACCAOCA (XACTGAGAT 1200 
PKL AAA LEHH HHH H . D 

CXDQQCIGCTA ACAAAGOQOG AAAGGAAGCT GAGITQGCIN GIQQCNA 1247 
PAAN KAR KEA ELAX G 
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ATOGCTAQCA TCACTGGIGG ACAGCAAAIG QGTCX3GATCC TAGAACGTAT 50 
MASM TGG QQM GRIL ERI 

TC7IGGAGAAT TQQGAOCAAT GTGACACICA GAOGCTAAGA AAGAAADGAT 100 
LEN WDQC DTQ TLR KKRF 

TTATATICIT CIGCAGTAOC GO^IGGCCAC AATATXXTCT TCAAGGGAGA 150 
IFF CST AWPQ YPL QGR 

GAAACCIG3C TIQGIGAGGG AAGTATAAAT TATAACATCA TCITACAGCT 200 
ETWL PEG SIN Y N I I LQL 

AGACCTCTIC TCTAGAAAGG AGQGCAAATG GAGTGAAGIG OCATATGIGC 250 
D L F CRKE GKW SEV.PYVQ 

AAACTTTCTT TICATTAAGA GACAACTCAC AATTATCTAA AAAGIUIGGT 300 
TFF SLR DNSQ LCK KCG 

TTATGQOCEA CAGGAAGQCC TCAG^GTCCA CCKXXTFNJ2 CCAGQGIOCC 350 
LCPT GSP QSP PPYP SVP 

CIUDQDGACT CCTTQCTCAA CTAATAAGGA QCXXXXTTTA AQXAAAGGG 400 
SPT PSST NKD PPL TQTV 

TQCAAAAGGA GAEAGACAAA GGGGEAAACA ATCAACCAAA GAGIGCGAAT 450 
QKE IDK GVNN EPK SAN 

ATTCCXXmr tatcoooxt o^aagcsgig AGAGGAGGAG AATIOGGCOC 500 
IPRL CPL Q A V RGGE FGP 

AGOCAGAGIG (XTCEAGGTT TITCTCICIC AGACTTAAAG CAAAITAAAA 550 
A R V PVPF SLS DLK Q I K I 

TAGACCTAQG TAAATTCTCA GATAACGGIG ACGQCTATAT TGAIUTTTTA 600 
DLG KFS DNPD GYI DVL 

CAAQGGTEAG GACAATOC7IT TGATGIGACA T3G&GAGATA TAAIGTEACT 650 
QGLG QSF DLT WRDI MLL 

ACIAAATCAG ACACTAAOOC CAAAIGAGAG AAGIGOOQCT GTAACTGCAG 700 
LNQ TLTP NER SAA VTAA 

GQOGAGAGIT TOGCX^VICIT TGGIAICICA GICAGQOCAA CAATAQGATC 750 
REF GDL WYLS Q A N NRM 

ACAACAGAGG AAAGAACAAC TCXXACMQC CAGCAGQCAG TICOCAGrsr 800 
TTEE RTT PTG QQAV PSV 
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AGADQCTCAT TQGGACACAG AATCAGAACA. TQG&GATIGG TGCOCAAAC 850 
DPH WDTE SEH GDW CHKH 

ATITGCTAAC TIGCGTGCTA GAAGGACIGA GGAAAACTAG GAAGAAGOCT 900 
LLT CVL EGLR KTR KKP 

ATGAATTACT CAATGATCflC CACTATAACA CAGQGAAAQG AAGAAAATCT 950 
MNYS MMS TIT QGKE ENL 

Tftcrocrrrr ctogacagac taagsgaggc atigaggaag cataoctggc 1000 

TAP LDRL REA LRK HTSL 

1GICACCTGA CTCTATTGAA GGCCAACTAA TCTTAAAGGA TAACTTTATC 1050 
SPD SIE GQLI LKD KFI 

ACICAGICAG CIGCAGACAT TAGAAAAAAC TTCAAAAGIC TGOCTAAGCT 1100 
TQSA ADI RKN FKSL PKL 

TQ03QOCGCA CTCGAGCADC AOC^OCAOCA CCACIGAGAT OOQQCTQCTA 1150 
AAA LEHH HHH H.D PAAN 



ACAAAGOOCG AAAGGAAGCT GAGTIQGCIG GIGGCA 
KAR KEA ELAG G 
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TGTOQGCIGT GCIOCIGATC CAGCACAGGC QOOCATTGOC TC7ICGCAATT 50 
CPLC S.S STG AHCL SQL 
VRC APDP AQA PIA SPNW 
SAV L L I QHRR PLP LPI 

GGQCTAAAQG CTTGGCATTG TTOCTGCACA GCTAAGTGOC TGGGTTCATC 100 
G.R L A I V PAQ LSA WVHP 
AKG L P L FLHS .VP GFI 
GLKA CHC SCT A K C L GSS 

CTAA.TCGAGC T3AACACTAG TCACIQGGTT GCAQQGTTCT CTTCCATGAC 150 

N R A EH. SLGS TVL FHD 
LIEL NTS HWV PRFS SMT 
. SS T L V TGF HGS LP.P 

GCATGGCTTC TAATAGAGCT ATAACACTCA CIGCATGGTC CAAGATTOCA 200 
PWLL IEL . H S LHGP RFH 
HGF SY NTH CMV QDSI 

MAS N R A ITLT AWS KIP 

TIOCTTGGAA TCGGIGAGAC GAAGAAGOOC AGGTGAGAGA ACACAAGGCT 250 
SLE SVRP RTP GQR TQGL 
PWN P.D QEPQ VRE HKA 
FLGI RET KNP RSEN TRL 

TGCCAGCATG TTGGAAGCAG GOCACCAGCA TTTIGGAAGC AGGOOGGCAC 300 

PPC WKQ PTTI LEA ARH 
CHHV GSS PPP FWKQ PAT 
ATM LEAA HHH FGS SPPL 

TATCTTGGGA GCTCTGGGAG CAAGGACOOC AGGTAACAAT TTGGIGAQCA 350 
YLGS SGS KDP R.QF GDH 
ILG ALGA RTP GNN LVTT 
SWE LWE QGPQ VTI W . P 

CGAAGGGACC TGAATGGGGA AGCATGAAGG GATCIOCAAA GCAATIGGAA 400 
EGT I R N H EG ISK AIGN 

KGP .ESA TMKG SPK QLE 
RRDL NPQ P.R DLQS NWK 
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ATGnCCIGC CAAGGCAAAA ATGCCCCTAA GATGTATICT QGAGAATIGG 450 

VPP KAK MPLR CIL ENW 
MFLPRQKCP. DVF W R I G 
CSS QGKN APK MYS GELG 

GACCAATTIG AGCCICAGAC AGTAAGAAAA AAATGACTTA mTTCTICIG 500 
DQFD PQT VRK K.LI FFC 
T NL TLRQ . E K NDL YSS A 
PI. PSD SKKK MTY ILL 



CAGTACCGCC CIGGGCACGA TATCCICTIC AAGGGGGAGA AACCIQGCCT 
STA LATI SSS RGR NLAS 
VPP WPR YPLQ GGE TWP 
QYRP GHD ILF KGEK PGL 

CCIGAGQGAA GTATAAATTA TAACACCATC TIACAGCTAG ACCIGTITIG 

GK YKL H H L TAR P V L 

PEGS INY N T I L Q L D L F C 
L RE V.II TPS YS. TCFV 

TAGAAAAGGA GGCAAATGGA GTGAAGTGCC ATATITACAA ACTTTXTITT 
. K R R Q M E S A IF T N F L F 

RKG GKWS EVP YLQ 
EKE ANG VKCH I Y K LSF 

CATTAAAAGA CAACICGCAA TTATGITAAC AGIGTGATTT GIGTICCTAC 
IKR QLAI MLT V . F V F L H 
Li K D NSQ LC.Q CDL C S Y 
H.KT TRN YVN SVIC VPT 

ACGGAAQCGC TCAGATICTA CTCCCCACCC CCGGCATCTC CCCTGAATCC 

G S P Q I L L P T P G I S P E S 
TEAL RFY SPP PASP ^N P 
RKP SDST PHP RHL P. IP 

CICOCTAACT TATT 
L P N L 
S P T Y 
P Q L I 
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FIG 10 



10 



20 



30 



40 



50 



1234567890 1234567890 1234567890 1234567 890 1234567890 

TOIQCQCIGT GCTCCTGATC CAGCACAQGC QCCCATTGCC TCICQCAATT 50 
CPLC S.S STG A H C L SQL 
VRC APDP A Q A PIA SPNW 
SAV L L I QHRR PLP LPI 

GGGCTAAAGG CTIGGCATTG TTCCTGCACA GCTAAGTGCC TGOGTTCATC 100 
G.R LAIV PAQ LSA WVHP 
AKGLPLFLHS .VPGFI 
GLKA CHC SCT AKCL GSS 

CTAATQGAGC TGAACACTAG TCACTGGGTT GCAGQGTTCT CTTOCATGAC 150 

NRA EH. SLGS TVL FHD 
LIEL NTS HWV PRFS SMT 
. S S T L V TGF HGS LP.P 

CCATGQCITC TAATAGAGCT ATAACACTCA CK3CATGGIC CAAGATTCCA 200 
P W L L IEL . H S LHGP RFH 
HGF . . S Y NTH CMV QDSI 
MAS NRA ITLT AWS KIP 

TTCCTIGGAA TCQGTGAGAC CAAGAAGOCC AGGTCAGAGA ACACAAQQCT 250 
SLE SVRP RTP GQR TQGL 
PWN P.D QEPQ VRE HKA 
FLGI RET KNP RSEN TRL 

TGCCAGCATG TTGGAAGCAG OOCACCAGCA TTTIGGAAGC G3CGGGGCAC 300 

PPC WKQ PTTI LEA ARH 
CHHV GSS PPP FWKR PAT 
ATM LEAA HHH FGS GPPL 

TATCITGGGA GCICIGGGAG CAAGGAGGOC CAGGTAACAA TITGGTGACC 35C 
YLGS SGS KDP QVTI W . P 
ILG ALGA RTP R . Q FGDH 
SWE LWE Q.GPP GNN LVT 

ACGAAQQGAC CTGAATGQGC AAOCATGAAG GGATCTOCAA AGCAATTGGA 40C 
RRD LNPQ P.R DLQ SNWK 
EGT .IRNHEG ISKAIG 
TKGP ESA TMK GSPK QLE 
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AAT3TICCTC CCAAQGCAAA AAT3CCCCTA AGAT3TATTC TOGAGAATTG 450 

CSS QGK NAPK MYS GEL 
NVPP KAK MPL RCIL ENW 
MFL PRQK CP. DVF WRIG 

GGACCAATCT CAOXTCAGA CAGTAAGAAA AAAAATGACT TATATTCTIC 500 
GPI. PSD SKK KNDL YSS 
DQS DPQT VRK KMT YILL 
TNL T L R Q.EK K.L IFF 

TOCAGTACCG CCTGGCCACG GATATCCIUT TCAAGGGGGA GAAACCTGGC 550 
AVP PGHG YPL QGG ETWP 
QYR L A T DILF KGE KPG 
CSTA WPR ISS SRGR NLA 

CICCTGAGQG AAGTATAAAT TATAACACCA TCTTACAGCT AGACCTGTTT 600 

PEG SIN YNTI LQL DLF 
LLRE V.I ITP SYS. TCF 
S.G KYKL . H H LTA RPVL 

TCEAGAAAAG GAGGCAAATG GAGTGAAGIG CCATATITAC AAACITICTT 650 
CRKG GKW SEV PYLQ TFF 
VEK EANG VKC H I Y KLSF 
. K R RQM E.SA IFT NFL 

TTCATTAAAA GACAACTCGC AATTATGTAA ACAGIGTGAT TIGTGICCTA 700 
SLK DNSQ LCK QCD LCPT 
H.K TTR NYVN SVI CVL 
FIKR QLA IM. TV.F VSY 

CAGGAAQCCC TCAGATCTAC CICCCTACCC CGGCATCTCC CIGACTCCTT 750 

GSPQIYLPTPASP . L L 
QEAL RST SLP RHLP DSF 
RKP SDLP PYP GIS LTPS 

CCCCAACTAA TAAGGACCCA CTTCAGCCCA AACAGTCCAA AAGGACATAG 800 
PQLI RTH FSP NSPK GH 
PN. GPT SAQ TVQ KD I 

PTN KDP LQPK QSK RT. 
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FIG 11 
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QGOVTIGA.TA GCAOCCATCA GATO30CAAA TCATTATITA CIGGACCAGG 50 
GIDS THQ MAK SLFT GPG 
ALI APIR WPN HYL LDQA 
H. . HPS DGQI IIY WTR 

C Cl'l'l'l CAAA ACTA.TCAAGC AGATAGGGCC CGIGAAGCAT GCCAAAGAAA 100 
LFK TIKQ IGP VKH AKEI 
FSK LSS R.GP - SM PKK 
PFQN YQA DRA RE A C QRN 

TAATCCCCTG CCTrATOQCC ATGITCCTTC AGGAGAACAA AGAACAGQCC 150 

IPC L I A MFLQ ENK EQA 
.SPA LSP CSF RRTK NRP 
NPL PYRH VPS GEQ RTGH 

ATEACCCAGG GGAAGACTGG CAACTAGATT TTACCCACAT QGCCAAATGT 200 
ITQG KTG N.I LPTW PNV 
LPR GRLA TRF YPH GQMS 
YPG EDW QLDF T HM AKC 

CAGOGATTTC AGCAICTACT AGICIQGQCA GATACTTICA CIGGTIQGGT 250 
RDF SIY. SGQ ILS LVGW 
GIS AST SL G R Y F H W L G 
QGFQ HLL VWA DTFT GWV 

GGAGICITCT GCTIGTAGGA CAGAAAAGAC CCAAGAGGTA ATAAAGQCAC 300 

SLLLVGQKRPKR. .RH 
GVFS L.D R KD PRGN KGT 
ESS PCRT EKT QEV IKAL 

TAATGAAATA ATTCCCAGAT TIGGACTTCC CCCAGGATTA. CAGQGIGACA 350 
.NN SQI WTS PRIT G.Q 
NEI IPRF GLP PGL QGDN 
MK. FPD LDFP QDY R ■ V T 
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FIG 11 (suite) 
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ATGGQCCCGC TITCAAGOCT GCAGEAACOC AG3GAGTATC CCAGGTGTTA 400 
WPR FQGC SNP GSI PGVR 
GPA FKA AVTQ GVS QVL 
MA PL SRL Q.P REYP RC. 

G3CATACAAT ATCACTTACA CTGTGCCTGG AGGCCACAAT GCTCCAGAAA 450 

HTI SLT LCLE ATI LQK 
GIQY HLH CAW RPQS SRK 
AYN ITYT VPG GHN PPEK 

AGTCAAGAAA ATGAATGAAA CACICAAAGA TCTAAAAAAG CTAACCCAAG 500 
SQEN E.N TQR SKKA NPR 
VKK MNET LKD LKK LTQE 
SRK .MKHSKI .KS .PK 

AAACCCACAT TGCATGACCT GTICTGTTQC CTATAACCTT ACTAAGAATC 550 
NPH CMTC SVA YNL TKNP 
THI A.P VLLP ITL LRI 
KPTL HDL FCC L.PY .ES 

CATAACTATC CCCCAAAAAG CAQGACTTAG CCX2ATACGAG ATGCTATATC 600 

. LS PKK QDLA HTR CYM 
HNYP PKS RT. PIRD AIW 
IT I PQKA GLS PYE MLYG 

GATGGCCTTT CCTAACCAAT GACCTTGTGC TTGACTGAGA AATGGCCAAC 650 
DGLS .PM TLC LTEK WPT 
MAF PNQ. PCA L R NGQL 

WPF LTN DLVL D.E MAN 

i TTAGTTGCAG ACATCACCTC CTTAQCCAAA TATCAACAAG TIUTTAAAAC 700 

. LQ TSPP . P N INK FLKH 
SCR HHL LSQI STS S.N 
LVAD ITS LAK YQQV LKT 
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ATCACAQQGA ACCIOTCCCC GAGAGGAQQG AAAGGAACIA TTCCAOQCIG 750 

HRE PVP ERRE RNY STL 
ITGN LSP RGG KGTI PPW 
SQG TCPR EEG KEL FHPG 

GTGACA3G 758 
V T 
. H 
D M 
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1 

LISTE DE SEQUENCES 



(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 34 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

10 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 68: 

GACTCGCTGC AGATCGATTT TTTTTTTTTT TTTT 3 4 



(2) INFORMATIONS POUR LA SEQ ID NO: 69: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

2 0 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 69: 

GCCATCAAGC CACCCAAGAA CTCTTAACTT 30 

(2) INFORMATIONS POUR LA SEQ ID NO: 70: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

3 0 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 70: 

CCAATAGCCA GACCATTATA TACACTAATT 30 



(2) INFORMATIONS POUR LA SEQ ID NO: 112: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 
3 5 (A) LONGUEUR: 310 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 112: 
5 GCTTATAGAA GGACCCCTAG TATGGGGTAA TCCCCTCTGG GAAACCAAGC CCCAGTACTC 60 
AGCAGGAAAA ATAGAATAGG AAACCTCACA AGGACATACT TTCCTCCCCT CCAGATGGCT 120 
AGCCACTGAG GAAGGAAAAA TACTTTCACC TGCAGCTAAC CAACAGAAAT TACTTAAAAC 180 
CCTTCACCAA ACCTTCCACT TAGGCATTGA TAGCACCCAT CAGATGGCCA AATTATTATT 240 
TACTGGACCA GGCCTTTTCA AAACTATCAA GAAGATAGTC AGGGGCTGTG AAGTGTGCCA 300 
1 0 AAG AAATAAT 310 

(2) INFORMATIONS POUR LA SEQ ID NO: 113: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 103 acides aminees 
15 (B) TYPE: acide aminee 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 113: 
20 Leu He Glu Gly Pro Leu Val Trp Gly Asn Pro Leu Trp Glu Thr Lys 

15 10 15 

Pro Gin Tyr Ser Ala Gly Lys He Glu Xaa Glu Thr Ser Gin Gly His 

20 25 30 

Thr Phe Leu Pro Ser Arg Trp Leu Ala Thr Glu Glu Gly Lys He Leu 
25 35 40 45 

Ser Pro Ala Ala Asn Gin Gin Lys Leu Leu Lys Thr Leu His Gin Thr 

50 55 60 

Phe His Leu Gly He Asp Ser Thr His Gin Met Ala Lys Leu Leu Phe 
65 70 75 80 

30 Thr Gly Pro Gly Leu Phe Lys Thr He Lys Lys He Val Arg Gly Cys 

85 90 95 

Glu Val Cys Gin Arg Asn Asn 
100 

35 (2) INFORMATIONS POUR LA SEQ ID NO: 114: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 



FEU1LLE DE REMPLACEMENT (REGLE 26) 
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(A) LONGUEUR: 635 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
5 (ii) TYPE DE MOLECULE: ADNc 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 


NO: 114: 






CCCTGTATCT 


TTAACCTCCT 


TGTTAAGTTT 


GTCTCTTCCA 


GAATCAAAAC 


TGTAAAACTA 


60 


CAAATTGTTC 


TTCAAATGGA 


GCACCAGATG 


GAGTCCATGA 


CTAAGATCCA 


CCGTGGACCC 


120 


CTGGACCGGC 


CTGCTAGCCC 


ATGCTCCGAT 


GTTAATGACA 


TTGAAGGCAC 


CCCTCCCGAG 


180 


GAAATCTCAA 


CTGCACAACC 


CCTACTATGC 


CCCAATTCAG 


CGGGAAGCAG 


TTAGAGCGGT 


240 


CATCAGCCAA 


CCTCCCCAAC 


AGCACTTGGG 


TTTTCCTGTT 


GAGAGGGGGG 


ACTGAGAGAC 


300 


AGGACTAGCT 


GGATTTCCTA 


GGCCAACGAA 


GAATCCCTAA 


GCCTAGCTGG 


GAAGGTGACT 


360 


GCATCCACCT 


CTAAACATGG 


GGCTTGCAAC 


TTAGCTCACA 


CCCGACCAAT 


CAGAGAGCTC 


420 


ACTAAAATGC 


TAATTAGGCA 


AAAATAGGAG 


GTAAAGAAAT 


AGCCAATCAT 


CTATTGCCTG 


480 


AGAGCACAGC 


GGGAGGGACA 


AGGATCGGGA 


TATAAACCCA 


GGCATTCGAG 


CCGGCAACGG 


540 


CAACCCCCTT 


TGGGTCCCCT 


CCCTTTGTAT 


GGGCGCTCTG 


TTTTCACTCT 


ATTTCACTCT 


600 


ATTAAATCTT 


GCAACTGAAA 


AAAAAAAAAA 


AAAAA 






635 



(2) INFORMATIONS POUR LA SEQ ID NO: 115: 
20 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 77 acides aminees 

(B) TYPE: acide aminee 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
25 (ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 115: 
Pro Cys lie Phe Asn Leu Leu Val Lys Phe Val Ser Ser Arg lie Lys 
15 10 15 

Thr Val Lys Leu Gin lie Val Leu Gin Met Glu His Gin Met Glu Ser 
30 20 25 30 

Met Thr Lys lie His Arg Gly Pro Leu Asp Arg Pro Ala Ser Pro Cys 

35 40 45 

Ser Asp Val Asn Asp lie Glu Gly Thr Pro Pro Glu Glu lie Ser Thr 
50 55 60 

35 Ala Gin Pro Leu Leu Cys Pro Asn Ser Ala Gly Ser Ser 

65 70 75 
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(2) INFORMATIONS POUR LA SEQ ID NO: 116: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 32 paires de bases 
5 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 116: 
10 TGGGGTTCCA TTTGTAAGAC CATCTGTAGC TT 32 

(2) INFORMATIONS POUR LA SEQ ID NO: 117: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1481 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 117: 

20 ATGGCCCTCC CTTATCATAC TTTTCTCTTT ACTGTTCTCT TACCCCCTTT CGCTCTCACT 60 

GCACCCCCTC CATGCTGCTG TACAACCAGT AGCTCCCCTT ACCAAGAGTT TCTATGAAGA 120 

ACGCGGCTTC CTGGAAATAT TGATGCCCCA TCATATAGGA GTTTATCTAA GGGAAACTCC 180 

ACCTTCACTG CCCACACCCA TATGCCCCGC AACTGCTATA ACTCTGCCAC TCTTTGCATG 240 

CATGCAAATA CTCATTATTG GACAGGGAAA ATGATTAATC CTAGTTGTCC TGGAGGACTT 300 

2 5 GGAGCCACTG TCTGTTGGAC TTACTTCACC CATACCAGTA TGTCTGATGG GGGTGGAATT 360 

CAAGGTCAGG CAAGAGAAAA ACAAGTAAAG GAAGCAATCT CCCAACTGAC CCGGGGACAT 420 

AGCACCCCTA GCCCCTACAA AGGACTAGTT CTCTCAAAAC TACATGAAAC CCTCCGTACC 480 

CATACTCGCC TGGTGAGCCT ATTTAATACC ACCCTCACTC GGCTCCATGA GGTCTCAGCC 540 

CAAAACCCTA CTAACTGTTG GATGTGCCTC CCCCTGCACT TCAGGCCATA CATTTCAATC 600 

3 0 CCTGTTCCTG AACAATGGAA CAACTTCAGC ACAGAAATAA ACACCACTTC CGTTTTAGTA 660 

GGACCTCTTG TTTCCAATCT GGAAATAACC CATACCTCAA ACCTCACCTG TGTAAAATTT 720 

AGCAATACTA TAGACACAAC CAGCTCCCAA TGCATCAGGT GGGTAACACC TCCCACACGA 780 

ATAGTCTGCC TACCCTCAGG AATATTTTTT GTCTGTGGTA CCTCAGCCTA TCATTGTTTG 840 

AATGGCTCTT CAGAATCTAT GTGCTTCCTC TCATTCTTAG TGCCCCCTAT GACCATCTAC 900 

3 5 ACTGAACAAG ATTTATACAA TCATGTCGTA CCTAAGCCCC ACAACAAAAG AGTACCCATT 960 

CTTCCTTTTG TTATCAGAGC AGGAGTGCTA GGCAGACTAG GTACTGGCAT TGGCAGTATC 1020 
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ACAACCTCTA CTCAGTTCTA CTACAAACTA 

GTCACTGACT CCCTGGTCAC CTTGCAAGAT 

CAAAATCGAA GAGCTTTAGA CTTGCTAACC 

GGAGAAGAAC GCTGTTATTA TGTTAATCAA 

5 ATTCGAGATC GAATACAATG TAGAGCAGAG 

CTCAGCCAAT GGATGCCCTG GGTTCTCCCC 

TTACTCCTCT TTGGACCCTG TATCTTTAAC 

GAAGCTGTAA AGCTACAGAT GGTCTTACAA 



5 

TCTCAAGAAA TAAATGGTGA CATGGAACAG 1080 

CAACTTAACT CCCTAGCAGC AGTAGTCCTT 1140 

GCCAAAAGAG GGGGAACCTG TTTATTTTTA 1200 

TCCAGAATTG TCACTGAGAA AGTTAAAGAA 1260 

GAGCTTCAAA ACACCGAACG CTGGGGCCTC 1320 

TTCTTAGGAC CTCTAGCAGC TCTAATATTG 1380 

CTCCTTGTTA AGTTTGTCTC TTCCAGAATT 1440 

ATGGAACCCC A 1481 



10 (2) INFORMATIONS POUR LA SEQ ID NO: 118: 
(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 493 acides aminees 

(B) TYPE: acide aminee 

(C) NOMBRE DE BRINS: simple 
15 ( D ) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 118: 
Met Ala Leu Pro Tyr His Thr Phe Leu Phe Thr Val Leu Leu Pro Pro 
15 10 15 

20 Phe Ala Leu Thr Ala Pro Pro Pro Cys Cys Cys Thr Thr Ser Ser Ser 

20 25 30 

Pro Tyr Gin Glu Phe Leu Xaa Arg Thr Arg Leu Pro Gly Asn lie Asp 

35 40 45 

Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Asn Ser Thr Phe Thr Ala 
25 50 55 60 

His Thr His Met Pro Arg Asn Cys Tyr Asn Ser Ala Thr Leu Cys Met 
65 70 75 80 

His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro Ser Cys 
85 90 95 

30 Pro Gly Gly Leu Gly Ala Thr Val Cys Trp Thr Tyr Phe Thr His Thr 

100 105 110 

Ser Met Ser Asp Gly Gly Gly lie Gin Gly Gin Ala Arg Glu Lys Gin 

115 120 125 

Val Lys Glu Ala lie Ser Gin Leu Thr Arg Gly His Ser Thr Pro Ser 
35 130 135 140 

Pro Tyr Lys Gly Leu Val Leu Ser Lys Leu His Glu Thr Leu Arg Thr 
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145 150 155 160 

His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Arg Leu His 

165 170 175 

Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp Met Cys Leu Pro Leu 
5 180 185 190 

His Phe Arg Pro Tyr lie Ser lie Pro Val Pro Glu Gin Trp Asn Asn 

195 200 205 

Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro Leu Val 
210 215 220 

10 Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val Lys Phe 

225 230 235 240 

Ser Asn Thr He Asp Thr Thr Ser Ser Gin Cys He Arg Trp Val Thr 

245 250 255 

Pro Pro Thr Arg He Val Cys Leu Pro Ser Gly He Phe Phe Val Cys 
15 260 265 270 

Gly Thr Ser Ala Tyr His Cys Leu Asn Gly Ser Ser Glu Ser Met Cys 

275 280 285 

Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu Gin Asp 
290 295 300 

20 Leu Tyr Asn His Val Val Pro Lys Pro His Asn Lys Arg Val Pro He 

305 310 315 320 

Leu Pro Phe Val lie Arg Ala Gly Val Leu Gly Arg Leu Gly Thr Gly 

325 330 335 

He Gly Ser He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu Ser Gin 
25 340 345 350 

Glu He Asn Gly Asp Met Glu Gin Val Thr Asp Ser Leu Val Thr Leu 

355 360 365 

Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn Arg Arg 
370 375 380 

3 0 Ala Leu Asp Leu Leu Thr Ala Lys Arg Gly Gly Thr Cys Leu Phe Leu 

385 390 395 400 

Gly Glu Glu Arg Cys Tyr Tyr Val Asn Gin Ser Arg He Val Thr Glu 

405 410 415 

Lys Val Lys Glu He Arg Asp Arg He Gin Cys Arg Ala Glu Glu Leu 
35 420 425 430 

Gin Asn Thr Glu Arg Trp Gly Leu Leu Ser Gin Trp Met Pro Trp Val 
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435 440 445 

Leu Pro Phe Leu Gly Pro Leu Ala Ala Leu lie Leu Leu Leu Leu Phe 

450 455 460 

Gly Pro Cys lie Phe Asn Leu Leu Val Lys Phe Val Ser Ser Arg lie 
5 465 470 475 480 

Glu Ala Val Lys Leu Gin Met Val Leu Gin Met Glu Pro 
485 490 

(2) INFORMATIONS POUR LA SEQ ID NO: 119: 
10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
15 (ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 119: 
TCAAAATCGA AGAGCTTTAG ACTTGCTAAC CG 32 

(2) INFORMATIONS POUR LA SEQ ID NO: 120: 

2 0 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1329 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
25 (ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 120: 

TCAAAATCGA AGAGCTTTAG ACTTGCTAAC CGCCAAAAGA GGGGGAACCT GTTTATTTTT 60 

AGGGGAAGAA TGCTGTTAGT ATGTTAATCA ATCTGGAATC ATTACTGAGA AAGTTAAAGA 120 

AATTTGAGAT CG AATATAAT GTAGAGCAGA GGACCTTCAA AACACTGCAC CCTGGGGCCT 180 

3 0 CCTCAGCCAA TGGATGCCCT GGACTCTCCC CTTCTTAGGA CCTCTAGCAG CTATAATATT 240 

TTTACTCCTC TTTGGACCCT GTATCTTCAA CTTCCTTGTT AAGTTTGTCT CTTCCAGAAT 300 

TGAAGCTGTA AAGCTACAAA TAGTTCTTCA AATGGAACCC CAGATGCAGT CCATGACTAA 360 

AATCTACCGT GGACCCCTGG ACCGGCCTGC TAGACTATGC TCTGATGTTA ATGACATTGA 420 

AGTCACCCCT CCCGAGGAAA TCTCAACTGC ACAACCCCTA CTACACTCCA ATTCAGTAGG 480 

35 AAGCAGTTAG AGCAGTTGTC AGCCAACCTC CCCAACAGTA CTTGGGTTTT CCTGTTGAGA 540 

GGGTGGACTG AG AG AC AGG A CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCNAAGCCT 600 
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ANCTGGGAAG GTGACCGCAT CCATCTTTAA 
ACCAATCAGA GAGCTCACTA AAATGCTAAT 
AATCATCTAT TGCCTGAGAG CACAGCGGGA 
TTCAAGCCAG CAACAGCAAC CCCCTTTGGG 

5 CACTCTATTT CACTCTATTA AATCATGCAA 
CTCAAGCTGA GCTTTTGTTC GCCATCCACC 
GCTGACTTCC ATCCCTTTGG ATCCAGCAGA 
ACCCATTGCC ACTCCCGATC AGGCTAAAGG 
TGGGTTTGTC CTAATAGAAC TGAACACTGG 

0 CCACGGCTTC TAATAGAGCT ATAACACTCA 
TCTGTGAGGC CAAGAACCCC AGGTCAGAGA 
CCCACTGCCA TTTTGGTAGC GGCCCACCAC 
CCAGTAACA 



8 

ACATGGGGCT TGCAACTTAG CTCACACCCG 660 
CAGGCAAAAA CAGGAGGTAA AGCAATAGCC 720 
AGGACAAGGA TTGGGATATA AACTCAGGCA 780 
TCCCCTCCCA TTGTATGGGA GCTCTGTTTT 840 
CTGCACTCTT CTGGTCCGTG TTTTTTATGG 900 
ACTGCTGTTT GCCACCGTCA CAGACCCGCT 960 
GTGTCCACTG TGCTCCTGAT CCAGCGAGGT 1020 
CTTGCCATTG TTCCTGCATG GCTAAGTGCC 1080 
TCACTGGGTT CCATGGTTCT CTTCCATGAC 1140 
CCGCATGGCC CAAGATTCCA TTCCTTGGTA 1200 
ANGTGAGGCT TGCCACCATT TGGGAAGTGG 12 60 
CATCTTGGGA GCTGTGGGAG CAAGGATCCC 13 20 

1329 



5 (2) INFORMATIONS POUR LA SEQ ID NO: 121: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 162 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 
0 (D ) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 121: 
Gin Asn Arg Arg Ala Leu Asp Leu Leu Thr Ala Lys Arg Gly Gly Thr 
15 10 15 

5 Cys Leu Phe Leu Gly Glu Glu Cys Cys Xaa Tyr Val Asn Gin Ser Gly 

20 25 30 

lie lie Thr Glu Lys Val Lys Glu lie Xaa Asp Arg lie Xaa Cys Arg 

35 40 45 

Ala Glu Asp Leu Gin Asn Thr Ala Pro Trp Gly Leu Leu Ser Gin Trp 
0 50 55 60 

Met Pro Trp Thr Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Phe 
65 70 75 80 

Leu Leu Leu Phe Gly Pro Cys He Phe Asn Phe Leu Val Lys Phe Val 
85 90 95 

5 Ser Ser Arg He Glu Ala Val Lys Leu Gin He Val Leu Gin Met Glu 

100 105 HO 
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Pro Gin Met Gin 
115 

Pro Ala Arg Leu 
130 

5 Glu Glu lie Ser 

145 

Ser Ser 



9 

Ser Met Thr Lys 
120 

Cys Ser Asp Val 
135 

Thr Ala Gin Pro 
150 



lie Tyr Arg Gly 

Asn Asp lie Glu 
140 

Leu Leu His Ser 
155 



Pro Leu Asp Arg 
125 

Val Thr Pro Pro 

Asn Ser Val Gly 
160 



(2) INFORMATIONS POUR LA SEQ ID NO: 122: 
10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
15 (ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 122: 
GGCATTGATA GCACCCATCA G 



(2) INFORMATIONS POUR LA SEQ ID NO: 12 3: 
2 0 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
2 5 (ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 123: 
CATGTCACCA GGGTGGAATA G 



(2) INFORMATIONS POUR LA SEQ ID NO: 124: 
3 0 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
35 (ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 124: 
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(2) INFORMATIONS POUR LA SEQ ID NO: 12 4: 



5 



(i) CARACTERISTXQUES DE LA SEQUENCE: 

(A) LONGUEUR: 758 paires de bases 

(B) TYPE: nucleotide 

<C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 124: 



GGCATTGATA 


GCACCCATCA 


GATGGCCAAA 


TCATTATTTA 


CTGGACCAGG 


CCTTTTCAAA 


60 


ACTATCAAGC 


AGATAGGGCC 


CGTGAAGCAT 


GCCAAAGAAA 


TAATCCCCTG 


CCTTATCGCC 


120 


ATGTTCCTTC 


AGGAGAACAA 


AGAACAGGCC 


ATTACCCAGG 


GGAAGACTGG 


CAACTAGATT 


180 


TTACCCACAT 


GGCCAAATGT 


CAGGGATTTC 


AGCATCTACT 


AGTCTGGGCA 


GATACTTTCA 


240 


CTGGTTGGGT 


GGAGTCTTCT 


CCTTGTAGGA 


CAGAAAAGAC 


CCAAGAGGTA 


ATAAAGGCAC 


300 


TAATGAAATA 


ATTCCCAGAT 


TTGGACTTCC 


CCCAGGATTA 


CAGGGTGACA 


ATGGCCCCGC 


360 


TTTCAAGGCT 


GCAGTAACCC 


AGGGAGTATC 


CCAGGTGTTA 


GGCATACAAT 


ATCACTTACA 


420 


CTGTGCCTGG 


AGGCCACAAT 


CCTCCAGAAA 


AGTCAAGAAA 


ATGAATGAAA 


CACTCAAAGA 


480 


TCTAAAAAAG 


CTAACCCAAG 


AAACCCACAT 


TGCATGACCT 


GTTCTGTTGC 


CTATAACCTT 


540 


ACTAAGAATC 


CATAACTATC 


CCCCAAAAAG 


CAGGACTTAG 


CCCATACGAG 


ATGCTATATG 


600 


GATGGCCTTT 


CCTAACCAAT 


GACCTTGTGC 


TTGACTGAGA 


AATGGCCAAC 


TTAGTTGCAG 


660 


ACATCACCTC 


CTTAGCCAAA 


TATCAACAAG 


TTCTTAAAAC 


ATCACAGGGA 


ACCTGTCCCC 


720 


GAGAGGAGGG 


AAAGGAACTA 


TTCCACCCTG 


GTGACATG 






758 



(2) INFORMATIONS POUR LA SEQ ID NO: 126: 
2 5 (i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



30 



(ii) TYPE DE MOLECULE: ADNC 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 126: 



CGGACATCCA AAGTGATGGG AAACG 



2 



35 



(2) INFORMATIONS POUR LA SEQ ID NO: 127: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 26 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 127: 

GGACAGGAAA GTAAGACTGA GAAGGC 26 



(2) INFORMATIONS POUR LA SEQ ID NO: 128: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 128: 

CCTAGAACGT ATTCTGGAGA ATTGGG 



(2) INFORMATIONS POUR LA SEQ ID NO: 129: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 
20 (A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 129: 

TGGCTCTCAA TGGTCAAACA TACCCG 



(2) INFORMATIONS POUR LA SEQ ID NO: 130: 
(i) CARACTERI STIQUES DE LA SEQUENCE: 
30 (A) LONGUEUR: 1511 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

35 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 130: 

CCTAGAACGT ATTCTGGAGA ATTGGG ACCA ATGTGACACT CAGACGCTAA GAAAGAAACG 
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ATTTATATTC TTCTGCAGTA CCGCCTGGCC 
GCTTCCTGAG GGAAGTATAA ATTATAACAT 
GGAGGGCAAA TGGAGTGAAG TGCCATATGT 
ACAATTATGT AAAAAGTGTG GTTTATGCCC 
5 CCCCAGCGTC CCCTCCCCGA CTCCTTCCTC 
GGTCCAAAAG GAGATAGACA AAGGGGTAAA 
ATTATGCCCC CTCCAAGCAG TGAGAGGAGG 
TTTTTCTCTC TCAGACTTAA AGCAAATTAA 
TGACGGCTAT ATTGATGTTT TACAAGGGTT 
10 TATAATGTTA CTACTAAATC AGACACTAAC 
AGCCCGAGAG TTTGGCGATC TTTGGTATCT 
GGAAAGAACA ACTCCCACAG GCCAGCAGGC 
AGAATCAGAA CATGGAGATT GGTGCCACAA 
GAGGAAAACT AGGAAGAAGC CTATGAATTA 
15 GGAAGAAAAT CTTACTGCTT TTCTGGACAG 
CCTGTCACCT GACTCTATTG AAGGCCAACT 
AGCTGCAGAC ATTAGAAAAA ACTTCAAAAG 
ACCCTATTTA ACTTGGCATC CTCAGTTTTT 
CGGGACAAAC GGGATAAAAA AAAAAGGGGG 
2 0 AAGCAGACTT TGGAGGCTCT GCAAAAGGGA 
CTGGCTTCCA GTGCGGTCTA CAAGGACACT 
CGCCCCCTTG TCCATGCCCC TTACGTCAAG 
GATGAAGATA CTCTGAGTCA GAAGCCATTA 
GCCCGGGGCG AGCGCCAGCC CATGCCATCA 
25 TTGAGAGCCA A 



12 

ACAATATCCT CTTCAAGGGA GAGAAACCTG 120 

CATCTTACAG CTAGACCTCT TCTGTAGAAA 180 

GCAAACTTTC TTTTCATTAA GAGACAACTC 240 

TACAGGAAGC CCTCAGAGTC CACCTCCCTA 300 

AACTAATAAG GACCCCCCTT TAACCCAAAC 3 60 

CAATGAACCA AAGAGTGCCA ATATTCCCCG 420 

AGAATTCGGC CC AG CCAG AG TGCCTGTACC 4 80 

AATAGACCTA GGTAAATTCT CAGATAACCC 5 40 

AGGACAATCC TTTGATCTGA CATGGAGAGA 600 

CCCAAATGAG AGAAGTGCCG CTGTAACTGC 660 

CAGTCAGGCC AACAATAGGA TGACAACAGA 720 

AGTTCCCAGT GTAGACCCTC ATTGGGACAC 7 80 

ACATTTGCTA ACTTGCGTGC TAGAAGGACT 840 

CTCAATGATG TCCACTATAA CACAGGGAAA 900 

ACTAAGGGAG GCATTGAGGA AGCATACCTC 960 

AATCTTAAAG GATAAGTTTA TCACTCAGTC 1020 

TCTGCCTTAG GCCCGGAGCA GAACTTAGAA 1080 

TATAATAGAG ATCAGGAGGA GCAGGCGAAA 1140 

GGTCCACTAC TTTAGTCATG GCCCTCAGGC 1200 

AAAGCTGGGC AAATCAAATG CCTAATAGGG 12 60 

TTAAAAAAGA TTATCCAAGT AGAAATAAGC 1320 

GGAATCACTG GAAGGCCCAC TGCCCCAGGG 1380 

ACCAGATGAT CCAGCAGCAG GACTGAGGGT 1440 

CCCTCACAGA GCCCCGGGTA TGTTTGACCA 1500 

1511 



(2) INFORMATIONS POUR LA SEQ ID NO: 131: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 352 acides amines 
3 0 (B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 131: 
35 Leu Glu Arg He Leu Glu Asn Trp Asp Gin Cys Asp Thr Gin Thr Leu 
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Arg Lys Lys Arg Phe lie Phe Phe Cys Ser Thr Ala Trp Pro Gin Tyr 

20 25 30 

Pro Leu Gin Gly Arg Glu Thr Trp Leu Pro Glu Gly Ser lie Asn Tyr 
35 40 45 

5 Asn lie He Leu Gin Leu Asp Leu Phe Cys Arg Lys Glu Gly Lys Trp 

50 55 60 

Ser Glu Val Pro Tyr Val Gin Thr Phe Phe Ser Leu Arg Asp Asn Ser 
65 70 75 80 

Gin Leu Cys Lys Lys Cys Gly Leu Cys Pro Thr Gly Ser Pro Gin Ser 
10 85 90 95 

Pro Pro Pro Tyr Pro Ser Val Pro Ser Pro Thr Pro Ser Ser Thr Asn 

100 105 110 

Lys Asp Pro Pro Leu Thr Gin Thr Val Gin Lys Glu He Asp Lys Gly 
115 120 125 

15 Val Asn Asn Glu Pro Lys Ser Ala Asn He Pro Arg Leu Cys Pro Leu 

130 135 140 

Gin Ala Val Arg Gly Gly Glu Phe Gly Pro Ala Arg Val Pro Val Pro 
145 150 155 160 

Phe Ser Leu Ser Asp Leu Lys Gin He Lys He Asp Leu Gly Lys Phe 
20 165 170 175 

Ser Asp Asn Pro Asp Gly Tyr He Asp Val Leu Gin Gly Leu Gly Gin 

180 185 190 

Ser Phe Asp Leu Thr Trp Arg Asp He Met Leu Leu Leu Asn Gin Thr 
195 200 205 

25 Leu Thr Pro Asn Glu Arg Ser Ala Ala Val Thr Ala Ala Arg Glu Phe 

210 215 220 

Gly Asp Leu Trp Tyr Leu Ser Gin Ala Asn Asn Arg Met Thr Thr Glu 
225 230 235 240 

Glu Arg Thr Thr Pro Thr Gly Gin Gin Ala Val Pro Ser Val Asp Pro 
30 245 250 255 

His Trp Asp Thr Glu Ser Glu His Gly Asp Trp Cys His Lys His Leu 

260 265 270 

Leu Thr Cys Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Pro Met 
275 280 285 

35 Asn Tyr Ser Met Met Ser Thr He Thr Gin Gly Lys Glu Glu Asn Leu 

290 295 300 
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Thr Ala Phe Leu Asp Arg Leu Arg Glu Ala Leu Arg Lys His Thr Ser 
305 310 315 320 

Leu Ser Pro Asp Ser He Glu Gly Gin Leu He Leu Lys Asp Lys Phe 
325 330 335 

5 He Thr Gin Ser Ala Ala Asp He Arg Lys Asn Phe Lys Ser Leu Pro 

340 345 350 



(2) INFORMATIONS POUR LA SEQ ID NO: 132: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 132: 

TGCTGGAATT CGGGATCCTA GAACGTATTC 3 

(2) INFORMATIONS POUR LA SEQ ID NO: 133: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 133: 
AGTTCTGCTC CGAAGCTTAG GCAGACTTTT : 

(2) INFORMATIONS POUR LA SEQ ID NO: 135: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 
30 (A) LONGUEUR: 398 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

35 ( X i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 135: 

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 



20 



25 
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15 10 15 

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gin Gin Met Gly Arg 

20 25 30 

lie Leu Glu Arg lie Leu Glu Asn Trp Asp Gin Cys Asp Thr Gin Thr 
5 35 40 45 

Leu Arg Lys Lys Arg Phe lie Phe Phe Cys Ser Thr Ala Trp Pro Gin 

50 55 60 

Tyr Pro Leu Gin Gly Arg Glu Thr Trp Leu Pro Glu Gly Ser lie Asn 
65 70 75 80 

10 Tyr Asn lie lie Leu Gin Leu Asp Leu Phe Cys Arg Lys Glu Gly Lys 

85 90 95 

Trp Ser Glu Val Pro Tyr Val Gin Thr Phe Phe Ser Leu Arg Asp Asn 

100 105 110 

Ser Gin Leu Cys Lys Lys Cys Gly Leu Cys Pro Thr Gly Ser Pro Gin 
15 115 120 125 

Ser Pro Pro Pro Tyr Pro Ser Val Pro Ser Pro Thr Pro Ser Ser Thr 

130 135 140 

Asn Lys Asp Pro Pro Leu Thr Gin Thr Val Gin Lys Glu lie Asp Lys 
145 150 155 160 

20 Gly Val Asn Asn Glu Pro Lys Ser Ala Asn lie Pro Arg Leu Cys Pro 

165 170 175 

Leu Gin Ala Val Arg Gly Gly Glu Phe Gly Pro Ala Arg Val Pro Val 

180 185 190 

Pro Phe Ser Leu Ser Asp Leu Lys Gin lie Lys lie Asp Leu Gly Lys 
25 195 200 205 

Phe Ser Asp Asn Pro Asp Gly Tyr lie Asp Val Leu Gin Gly Leu Gly 

210 215 220 

Gin Ser Phe Asp Leu Thr Trp Arg Asp lie Met Leu Leu Leu Asn Gin 
225 230 235 240 

30 Thr Leu Thr Pro Asn Glu Arg Ser Ala Ala Val Thr Ala Ala Arg Glu 

245 250 255 

Phe Gly Asp Leu Trp Tyr Leu Ser Gin Ala Asn Asn Arg Met Thr Thr 

260 265 270 

Glu Glu Arg Thr Thr Pro Thr Gly Gin Gin Ala Val Pro Ser Val Asp 
35 275 280 285 

Pro His Trp Asp Thr Glu Ser Glu His Gly Asp Trp Cys His Lys His 
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290 295 300 

Leu Leu Thr Cys Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Pro 
305 310 315 320 

Met Asn Tyr Ser Met Met Ser Thr lie Thr Gin Gly Lys Glu Glu Asn 
5 325 330 335 

Leu Thr Ala Phe Leu Asp Arg Leu Arg Glu Ala Leu Arg Lys His Thr 

340 345 350 

Ser Leu Ser Pro Asp Ser lie Glu Gly Gin Leu lie Leu Lys Asp Lys 
355 360 365 

10 Phe He Thr Gin Ser Ala Ala Asp lie Arg Lys Asn Phe Lys Ser Leu 

370 375 380 

Pro Lys Leu Ala Ala Ala Leu Glu His His His His His His 
385 390 395 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 137: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 378 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 
20 ( D ) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 137: 
Met Ala Ser Met Thr Gly Gly Gin Gin Met Gly Arg lie Leu Glu Arg 
15 10 15 

25 He Leu Glu Asn Trp Asp Gin Cys Asp Thr Gin Thr Leu Arg Lys Lys 

20 25 30 

Arg Phe He Phe Phe Cys Ser Thr Ala Trp Pro Gin Tyr Pro Leu Gin 

35 40 45 

Gly Arg Glu Thr Trp Leu Pro Glu Gly Ser He Asn Tyr Asn He He 
30 50 55 60 

Leu Gin Leu Asp Leu Phe Cys Arg Lys Glu Gly Lys Trp Ser Glu Val 
65 70 75 80 

Pro Tyr Val Gin Thr Phe Phe Ser Leu Arg Asp Asn Ser Gin Leu Cys 
85 90 95 

35 Lys Lys Cys Gly Leu Cys Pro Thr Gly Ser Pro Gin Ser Pro Pro Pro 

100 105 HO 
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Tyr Pro Ser Val Pro Ser Pro Thr Pro Ser Ser Thr Asn Lys Asp Pro 

115 120 125 

Pro Leu Thr Gin Thr Val Gin Lys Glu lie Asp Lys Gly Val Asn Asn 
130 135 140 

5 Glu Pro Lys Ser Ala Asn He Pro Arg Leu Cys Pro Leu Gin Ala Val 

145 150 155 160 

Arg Gly Gly Glu Phe Gly Pro Ala Arg Val Pro Val Pro Phe Ser Leu 

165 170 175 

Ser Asp Leu Lys Gin He Lys He Asp Leu Gly Lys Phe Ser Asp Asn 
10 180 185 190 

Pro Asp Gly Tyr He Asp Val Leu Gin Gly Leu Gly Gin Ser Phe Asp 

195 200 205 

Leu Thr Trp Arg Asp He Met Leu Leu Leu Asn Gin Thr Leu Thr Pro 
210 215 220 

15 Asn Glu Arg Ser Ala Ala Val Thr Ala Ala Arg Glu Phe Gly Asp Leu 

225 230 235 240 

Trp Tyr Leu Ser Gin Ala Asn Asn Arg Met Thr Thr Glu Glu Arg Thr 

245 250 255 

Thr Pro Thr Gly Gin Gin Ala Val Pro Ser Val Asp Pro His Trp Asp 
20 260 265 270 

Thr Glu Ser Glu His Gly Asp Trp Cys His Lys His Leu Leu Thr Cys 

275 280 285 

Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Pro Met Asn Tyr Ser 
290 295 300 

25 Met Met Ser Thr He Thr Gin Gly Lys Glu Glu Asn Leu Thr Ala Phe 

305 310 315 320 

Leu Asp Arg Leu Arg Glu Ala Leu Arg Lys His Thr Ser Leu Ser Pro 

325 330 335 

Asp Ser He Glu Gly Gin Leu He Leu Lys Asp Lys Phe He Thr Gin 
30 340 345 350 

Ser Ala Ala Asp He Arg Lys Asn Phe Lys Ser Leu Pro Lys Leu Ala 

355 360 365 

Ala Ala Leu Glu His His His His His His 
370 375 



35 



(2) INFORMATIONS POUR LA SEQ ID NO: 138: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
5 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 138: 
CTTGGAGGGT GCATAACCAG GGAAT 

10 (2) INFORMATIONS POUR LA SEQ ID NO: 139: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 139: 
TGTCCGCTGT GCTCCTGATC 

20 (2) INFORMATIONS POUR LA SEQ ID NO: 140: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
2 5 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 140: 
CTATGTCCTT TTGGACTGTT TGGGT 

30 (2) INFORMATIONS POUR LA SEQ ID NO: 141: 
(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 764 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
35 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 141: 



TG\L LCbw 1 \s I 






GCCCATTGCC 


TCTCCCAATT 


GGGCTAAAGG 


60 


CTTGCCA n. (j 






TGGGTTCATC 


CTAATCGAGC 


TGAACACTAG 


120 


TCACTGGGT1 






CCATGGCTTC 


TAATAGAGCT 


ATAACACTCA 


180 


CTGCATGGTC 


Lnnunl H_l_rt 




TCCGTGAGAC 


CAAGAACCCC 


AGGTCAGAGA 


240 


ACACAAGCjL I 






CCCACCACCA 


TTTTGGAAGC 


AGCCCGCCAC 


300 


TATCTTGGGA 


GCTCTGGGAG 


CAAGGACCCC 


AGGTAACAAT 


1 1 GG IbftuLn 




t fin 

J D \J 


TGAATCCGCA 


ACCATGAAGG 


GATCTCCAAA 


GCAATTGGAA 


ATGTTCCTCC 


CAAGGCAAAA 


420 


ATGCCCCTAA 


GATGTATTCT 


GGAGAATTGG 


GACCAATTTG 


ACCCTCAGAC 


AGTAAGAAAA 


480 


AAATGACTTA 


TATTCTTCTG 


CAGTACCGCC 


CTGGCCACGA 


TATCCTCTTC 


AAGGGGGAGA 


540 


AACCTGGCCT 


CCTGAGGGAA 


GTATAAATTA 


TAACACCATC 


TTACAGCTAG 


ACCTGTTTTG 


600 


TAGAAAAGGA 


GGCAAATGGA 


GTGAAGTGCC 


ATATTTACAA 


ACTTTCTTTT 


CATTAAAAGA 


660 


CAACTCGCAA 


TTATGTTAAC 


AGTGTGATTT 


GTGTTCCTAC 


ACGGAAGCCC 


TCAGATTCTA 


720 


CTCCCCACCC 


CCGGCATCTC 


CCCTGAATCC 


CTCCCCAACT 


TATT 




764 
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(2) INFORMATIONS POUR LA SEQ ID NO: 142: 
(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 800 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS: simple 



(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 142: 



TGTCCGCTGT 


GCTCCTGATC 


CAGCACAGGC 


GCCCATTGCC 


TCTCCCAATT 


GGGCTAAAGG 


60 


CTTGCCATTG 


TTCCTGCACA 


GCTAAGTGCC 


TGGGTTCATC 


CTAATCGAGC 


TGAACACTAG 


120 


TCACTGGGTT 


CCACGGTTCT 


CTTCCATGAC 


CCATGGCTTC 


TAATAGAGCT 


ATAACACTCA 


180 


CTGCATGGTC 


CAAGATTCCA 


TTCCTTGGAA 


TCCGTGAGAC 


CAAGAACCCC 


AGGTCAGAGA 


240 


ACACAAGGCT 


TGCCACCATG 


TTGGAAGCAG 


CCCACCACCA 


TTTTGGAAGC 


GGCCCGCCAC 


300 


TATCTTGGGA 


GCTCTGGGAG 


CAAGGACCCC 


CAGGTAACAA 


TTTGGTGACC 


ACGAAGGGAC 


360 


CTGAATCCGC 


AACCATGAAG 


GGATCTCCAA 


AGCAATTGGA 


AATGTTCCTC 


CCAAGGCAAA 


420 


AATGCCCCTA 


AGATGTATTC 


TGGAGAATTG 


GGACCAATCT 


GACCCTCAGA 


CAGTAAGAAA 


480 


AAAAATGACT 


TATATTCTTC 


TGCAGTACCG 


CCTGGCCACG 


GATATCCTCT 


TCAAGGGGGA 


540 


GAAACCTGGC 


CTCCTGAGGG 


AAGTATAAAT 


TATAACACCA 


TCTTACAGCT 


AGACCTGTTT 


600 


TGTAGAAAAG 


GAGGCAAATG 


GAGTGAAGTG 


CCATATTTAC 


AAACTTTCTT 


TTCATTAAAA 


660 


GACAACTCGC 


AATTATGTAA 


ACAGTGTGAT 


TTGTGTCCTA 


CAGGAAGCCC 


TCAGATCTAC 


720 


CTCCCTACCC 


CGGCATCTCC 


CTGACTCCTT 


CCCCAACTAA 


TAAGGACCCA 


CTTCAGCCCA 


780 
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(57) Abstract 

The invention concerns a nucleic material, in isolated or purified state, and a nucleotide fragment comprising a nucleotide sequence 
selected from the group consisting in (i) the sequences SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117, SEQ ID NO: 120, , SEQ 
ID NO. 124 SEQ ID NO: 130, SEQ ID NO: 141 and SEQ ID NO: 142, (ii) the complementary sequences of sequences (l); and (m) the 
sequences equivalent to sequences (ii) and (iii), in particular the sequence having for every series of 100 contiguous monomers, at least 
50 %, preferably 70 % homology with sequences (t) and (ii) respectively. The invention also concerns their uses for detecting a retrovirus 
associated with multiple sclerosis and/or rheumatoid arthritis. 



(57) Abreg^ 

Materiel nucieique, a l'etat isole ou purifie, et fragment nucleotidique, comprenant une sequence nucieotidique choisie dans le groupe 
qui consiste en (i) les sequences SEQ ID NO: 1 1 2, SEQ ID NO: 1 14, SEQ ID NO: 1 17, SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 
130, SEQ ID NO: 141 et SEQ ID NO: 142, (ii) les sequences compiementaires des sequences (i); et (iii) les sequences eqmvalentes aux 
sequences (i) ou (ii), en particulier les sequences presentant pour toute suite de 100 monomeres contigus, au moins 50 %, et preferentiellement 
au moins 70 % d'homologie avec respectivement les sequences (i) ou (ii), et utilisations pour detecter un retrovirus associe a la sclerose en 
plaques et/ou la polyarthrite rhumatoide. 
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Cadre « Observati ns - 1 rsqu'il a ete estlm qu certaines revendicati ns n pouvaient pas faire I'objet d'une re here he 
(suit du p int 1 d la premiere f uill ) 



Conformement a ('article 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour les motifs suivants: 

1. Les revendications n os 

se rapportent a un objet a I'egard duquei l'administration n'est pas tenue de proceder a ta recherche, a savotr: 



2. Les revendications n os 

se rapportent a des parties de la demande intemationale qui ne remplissent pas suffisamment les conditions prescntes pour 

qu'une recherche significative puisse etre effectuee, en particulier: 



3. Les revendications n 03 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 

troisieme phrases de la regie 6.4. a). 



Cadr II Observations - lorsqu'il y a absence d' unite de ('invention (suite du point 2 de la premiere feuiile) 



L'administration chargee de ia recherche intemationale a trouve plusteurs inventions dans la demande intemationale, a savoir: 



voir feuiile supplementaire 



H Comme toutes les taxes additionnelles ont ete payees dans les delais par le deposant, le present rapport de recherche 
intemationale porte sur toutes les revendications pouvant faire I'objet d'une recherche. 

1 1 Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort particulier 
justifiant une taxe additionnelle, l'administration n'a sollicite le paiement d'aucune taxe de cette nature. 



3. I I Comme une partie seulement des taxes additionnelles demandees a ete payee dans les delais par le deposant, le present 

I 1 rapport de recherche intemationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 

les revendications n 09 



4. I I Aucune taxe additionnelle demandee n'a ete payee dans les delais par le deposant. En consequence, le present rapport 

I ' de recherche intemationale ne porte que sur T invention mentionnee en premier lieu dans les revendications; elle est 

couverte par les revendications n os 



Remarque quant a la reserve 



| X| Les taxes additionnelles etaient accompagnees d'une reserve de la part du deposan 
j | Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 

L' administration chargee de la recherche Internationale a trouve 
plusieurs (groupes d') inventions dans la demande international, a 
savoir: 

1. revendications: 5 (completement) ,1-3, 13-20, 22-26 (partiel lement) 

Materiel nuclei que comprenant une sequence SEQ ID NO: 112, ou 
codant pour une peptide avec la sequence SEQ ID NO: 113, 
peptides correspondents, compositions comprenant un fragment 
desdites sequences et leur utilisation dans un procede pour 
detecter un retrovirus associe a la sclerose en plaques. 



2. revendications: 10 (completement) 1, 2, 7-9, 11-26 (partiel lement) 

Comme pour l'invention 1 mais se rapportant a SEQ ID N0:114, 

SEQ ID N0:115, SEQ ID N0:117, SEQ ID N0:118, SEQ ID N0:120 
et SEQ: ID: N0:121. 



3. revendications: 1, 3, 13-15, 18, 19, 21-26 (toutes partiel lement) 

Comme pour l'invention 1 mais se rapportant a SEQ ID NO: 124. 

4. revendications: 1, 2, 4, 6, 13-19, 21-26 (toutes partiel lement) 

Comme pour l'invention 1 mais se rapportant a SEQ ID N0:130, 
SEQ ID N0:131, SEQ ID N0:135 et SEQ ID N0:137. 



5. revendications: 1, 11, 13-15, 18-20, 22-26 (toutes partiellement) 

Comme pour l'invention 1 mais se rapportant a SEQ ID N0:141 
et SEQ ID NO: 142. 
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